Avatar CMLC - Université de Lomé
Le Web sémantique est en marche
par CMLC - Université de Lomé, jeudi 16 septembre 2010, 08:51
 

Créer un Web intelligent, c'est l'idée. Qu'entend-on par « intelligent » ? Un rêve déjà ancien : et si l'ordinateur pouvait comprendre la nature exacte de l'information que l'on recherche ? Pourrait-il aller au-delà de la simple requête booléenne de mots-clés répondant à l'unique question : quelles sont les pages contenant le terme X ? Il s'agit donc bien de faire évoluer nettement l'efficacité des moteurs de recherche, et donc du Web, en permettant à l'utilisateur de saisir sa demande d'information en langage naturel, en donnant à ces moteurs le pouvoir de donner un sens aux informations et de les présenter au chercheur de façon structurée, plus évoluée que la suite actuelle de liens mettant en évidence le seul terme recherché.

 

Depuis quelques semaines, le processus s'accélère et toutes ces belles paroles commencent doucement à prendre vie. Au mois de juillet, Google rachetait la firme Metaweb qui détient Freebase, une base de données très complète de douze millions d'éléments sur divers domaines tels une encyclopédie, destinée à être intégrée au moteur de recherche. Ce nouveau procédé pourrait permettre à Google de relier les informations entre elles et de leur donner du sens. Toutefois, rien n'est encore fait car il s'agit tout de même d'une technologie très complexe. Il faudra donc du temps et du travail en commençant à la source pour rendre possible ce projet, dès la publication du contenu. Car, pour faire remonter l'information, encore faut-il qu'elle soit bien indexée. Il sera donc nécessaire que les webmasters améliorent leurs techniques d'indexation en tagant avec précision les contenus. Dans le cas contraire, un effet pervers apparaîtra : les sites mal indexés seront mal référencés et perdront donc du trafic. Le problème n'est pas nouveau, mais sera certainement amplifié. La plate-forme de publication de blogs Wordpress montre déjà l'exemple depuis longtemps en permettant à ses utilisateurs de taguer ses articles.

 

Tout récemment, le projet européen IKS (Interactive Knowledge Stack) vient de lancer la phase de test de Fise (Furtwangen IKS Semantic Engine). Il s'agit d'un projet destiné à la gestion documentaire bénéficiant d'un financement européen de six milliards d'euros qui vise à mettre en service un moteur de recherche sémantique open source. Une version béta est prévue pour 2011 et une version finale est programmée pour 2012. En attendant, les technologies permettant de se connecter au Web et d'améliorer l'interactivité et l'utilité du Web fleurissent et posent ainsi un enjeu supplémentaire : au mois de juillet, nous venons d'atteindre la barre des cinq milliards d'appareils (téléphones, GPS, télévisions, caméras de surveillance, voitures etc.) connectés à Internet. Dans moins de dix ans, ce chiffre va quadrupler. Un enjeu de taille qui viendra certainement compliquer encore un peu plus la mise en place de cette révolution.

(AFNOR BIVI, 15/09/2010)