Le Web Sémantique venant à l’origine du monde universitaire peut-il s’appliquer au SI ? Selon lui, oui. On a d’abord eu des applications Web séparées, puis on a voulu les faire dialoguer ensemble à l’aide de middlewares (SOA), puis à l’aide de ressources (REST), et la dernière solution serait de descendre au niveau de la base de données.

Pour cela on utilise aujourd’hui un standard : RDF (Wikipédia)

Pour faire le web de données, RDF propose de structurer ce web sous forme de triplets :
sujet, prédicat, objet.

Le sujet représente la ressource à décrire
Le prédicat représente un type de propriété applicable à cette ressource
L'objet représente la valeur de la propriété.

Exemple : [Alexandre Bertails] [est] [une personne] : [sujet] [prédicat] [objet]

A partir de ces triplets, l’idée est de construire un graphe où chaque nœud du graphe peut se trouver n’importe où sur le web : le web devient une gigantesque base de données.

Qui dit base de données, dit langage de requêtage. C’est précisément l’objet de SPARQL (http://fr.wikipedia.org/wiki/SPARQL), qui définit :

  • Un langage de requêtage proche de SQL
  • Un protocole
  • Un formalisme pour les résultats (basé sur XML)

Avec ce langage de requêtage, utilisé à la dimension du web, les possibilités sont immenses.

Pour donner un exemple concret, le site dbpedia.org est un clone de Wikipedia structuré en RDF, et interrogeable via SPARQL. Ainsi, en accédant à la page http://dbpedia.org/sparql, vous pouvez effectuer des requêtes SPARQL sur l’ensemble du contenu Wikipedia, comme vous le feriez avec SQL sur votre base de données relationnelles.

Il faut le dire : c’est assez impressionnant.

Par contre, Alexandre Bertails nous l’indique bien : tout cela est encore très jeune. Certains standards datent de 2008, et certains éléments importants manquent, à commencer par des mécanismes de confiance et de preuve relatifs aux triplets RDF exposés : aujourd’hui, si tout le monde peut faire un triplet, il faut pouvoir faire le tri de ceux que l’on juge de confiance, auxquels on peut se fier.

Enfin, pour illustrer tous ces principes autour d’un exemple sexy, Alexandre a terminé par la présentation de l’implémentation d’un résolveur de Sodoku (démo à l’appui) basé sur les technologies du web sémantique, avec notamment une représentation des contraintes sous forme de graphes RDF.


Article rédigé par les sfeiriens du Paris JUG : Mohamed Abdennebi, Fabien Baligand, Tanguy Bayard, Tarik Filali Ansary, David Martin... au total plus de 10 sfeiriens à cette session !