CR Paris JUG - Partie 2 : Web Sémantique
Par Tanguy Bayard le lundi 16 mars 2009, 00:30 - Java - Lien permanent
Suite du compte-rendu de la soirée Wicket & Web sémantique, le premier billet consacré à Wicket est disponible ici.
Alexandre Bertails d’Atos Origin nous a ensuite présenté les dernières avancées en matière de Web Sémantique (ce que devait être le Web 2 et que pourrait être le Web 3).
L’idée du Web Sémantique a germé en 1994, de l’inventeur même du web Tim Berners-Lee. La terminologie « Web Sémantique » ne reflète pas ce que c’est réellement, une version plus exacte pourrait être « Web de données », l’objectif étant de partager ces données, d’en faciliter l’accès, et ceci indépendamment de la logique dont elles pourraient être récupérées/traitées/affichées.
Pour cela on utilise aujourd’hui un standard : RDF (Wikipédia)
Pour faire le web de données, RDF propose de structurer ce web sous forme de
triplets :
sujet, prédicat, objet.
Le sujet représente la ressource à
décrire
Le prédicat représente un type de
propriété applicable à cette ressource
L'objet représente la valeur de la propriété.
Exemple : [Alexandre Bertails] [est] [une personne] : [sujet] [prédicat] [objet]
A partir de ces triplets, l’idée est de construire un graphe où chaque nœud du graphe peut se trouver n’importe où sur le web : le web devient une gigantesque base de données.
Qui dit base de données, dit langage de requêtage. C’est précisément l’objet de SPARQL (http://fr.wikipedia.org/wiki/SPARQL), qui définit :
- Un langage de requêtage proche de SQL
- Un protocole
- Un formalisme pour les résultats (basé sur XML)
Avec ce langage de requêtage, utilisé à la dimension du web, les possibilités sont immenses.
Pour donner un exemple concret, le site dbpedia.org est un clone de Wikipedia structuré en RDF, et interrogeable via SPARQL. Ainsi, en accédant à la page http://dbpedia.org/sparql, vous pouvez effectuer des requêtes SPARQL sur l’ensemble du contenu Wikipedia, comme vous le feriez avec SQL sur votre base de données relationnelles.
Il faut le dire : c’est assez impressionnant.
Par contre, Alexandre Bertails nous l’indique bien : tout cela est encore très jeune. Certains standards datent de 2008, et certains éléments importants manquent, à commencer par des mécanismes de confiance et de preuve relatifs aux triplets RDF exposés : aujourd’hui, si tout le monde peut faire un triplet, il faut pouvoir faire le tri de ceux que l’on juge de confiance, auxquels on peut se fier.
Enfin, pour illustrer tous ces principes autour d’un exemple sexy, Alexandre a terminé par la présentation de l’implémentation d’un résolveur de Sodoku (démo à l’appui) basé sur les technologies du web sémantique, avec notamment une représentation des contraintes sous forme de graphes RDF.
Article rédigé par les sfeiriens du Paris JUG : Mohamed Abdennebi, Fabien Baligand, Tanguy Bayard, Tarik Filali Ansary, David Martin... au total plus de 10 sfeiriens à cette session !
