Le web comme on le connait indexe un nombre presque infini d’information sous forme de documents. Quand l’internaute formule une requête,  il interroge le robot du moteur de recherche qui livre des données brutes. Au final il lui faut néanmoins interpréter puis choisir l’information qu’il juge  la plus pertinente. 
Dans les années 2000, les documents étaient indexés par une méthode des années 60, indexation dite sémantique latente qui était introduite dans les algorithmes des moteurs. Elle consistait à un reclassement des textes selon un contexte global, pour permettre une lecture fine.
L’enjeu du web sémantique est de remédier à cette problématique, il promet des résultats plus en adéquation avec la requête de l’internaute. Ainsi, donner du sens aux milliards de documents indexés sur le web et délivrer « la réponse » attendue par l’internaute, sont les objectifs majeurs du web sémantique.
 
‘Knowledge Graph’ de Google
Tim Berners-Lee, l’inventeur du World Wide Web est à l’origine de l’orientation vers le web sémantique. Selon lui, celui-ci  « consiste non simplement à  connecter des pages de documents par des liens, mais aussi des concepts, des idées, des faits ». L’outil Knowledge Graph de Google est le premier pas qui s’inscrit dans cette démarche, avec une base de données  de 500 millions d’objets (personnes, lieux ou « choses »), complétés par 3,5 milliards de relations et d’attributs. Au lieu de renvoyer une liste de sites Web, la fonction Knowledge Graph répond directement aux requêtes des internautes en fonction de leur localisation géographique. Elle permet de croiser des informations entre elles et de fournir un accès direct pour encourager  l’internaute à ne pas quitter le moteur de recherche. Par exemple si on recherche « Taj Mahal », Google proposait par défaut une liste de liens les plus populaires, désormais les résultats seront compilés et accompagnés dans la colonne de droite des résultats organiques.
Lors d’une requête les mots peuvent avoir plusieurs sens. Avec cette option, on saura directement que Taj Mahal est un monument, mais aussi un musicien et un casino.
Knowledge Graph a été lancé aux USA en mai 2012, son déploiement dans le monde entier vient juste de débuter. Il sera accessible via le moteur de recherche mais seulement en langue anglaise.
 

A propos de Hajar EL HAMDOUCHI