Wikipedia : un moteur de recherche en langage naturel

le 14/05/2008 à 21:56
Wikipedia : un moteur de recherche en langage naturel
Rêve de linguiste, la recherche en langage naturel peut désormais être testée par les internautes sur les contenus de Wikipedia par l'intermédiaire d'un outil conçu par la société Powerset. Reposant sur l'interprétation de phrases construites plutôt que sur une sélection de mots clé et d'opérateurs booléens, la recherche en langage naturel est censée permettre de s'adresser à un moteur de recherche comme on parlerait à un interlocuteur.

Soutenu par Tim Berners Lee, l'un des pères fondateurs du Web actuel, le principe de "recherche naturelle" consiste à analyser de façon sémantique et syntaxique la proposition entrée à l'internaute, voir comment les mots employés par l'internaute s'articulent, pour déterminer le sens exact de sa recherche. Plutôt que de saisir des mots disparates, on posera donc sa question sous la forme d'une phrase complète.

"Contrairement aux autres moteurs de recherche, qui indexent des mots clé, Powerset effectue une analyse linguistique des phrases qu'il est amené à lire", explique la firme dans un communiqué. Autrement dit : comprendre le sens des mots au lieu de simplement repérer leurs occurrences dans d'éventuelles pages de résultat.

En gestation depuis plus de deux ans, le projet de Powerset lui a valu l'attention des plus grands tels que Google ou Microsoft qui, selon la rumeur, aurait envisagé de racheter cette société fondée en 2005 et basée à San Francisco. Cantonné aux pages anglophones de Wikipedia, Powerset offre effectivement des résultats différents de ceux que retournent un moteur traditionnel, et se révèle très efficace sur certaines requêtes. En ira-t-il de même lorsque Powerset tentera d'indexer l'infinie variété des pages présentes sur le Web ?

Commentaires

Ecrire

Ecrire un message

Votre message vient d'être créé avec succès.
LoadingChargement en cours