Recherche : Microsoft s'offre un moteur sémantique

le 02/07/2008 à 20:45
Recherche : Microsoft s'offre un moteur sémantique
L'avenir de la recherche chez Microsoft ne passera peut-être pas par Yahoo, mais le numéro un mondial des éditeurs n'abandonne pas pour autant ses velléités en matière de croissance externe sur Internet. Microsoft a en effet confirmé mardi l'acquisition de la société Powerset, dévolue au développement de techniques de recherche en langage naturel. Le montant de la transaction n'a pas été dévoilé, mais les initiés évoquent une somme avoisinant cent millions de dollars.

Basée à San Francisco, Californie, Powerset a été fondée en 2005. La start-up a reçu, l'année suivante, le soutien des fonds Foundation Capital, Founders Fund et Paperboy Ventures. En mai 2008, elle a lancé son premier produit commercial, un outil de recherche sémantique pour Wikipedia, l'encyclopédie collaborative en ligne.

Rêve de linguiste, la recherche en langage naturel, ou recherche sémantique, repose sur l'interprétation de phrases construites plutôt que sur une sélection de mots clé et d'opérateurs booléens. Défendue par Tim Berners Lee, l'un des pères fondateurs du Web actuel, elle consiste donc à analyser de façon sémantique et syntaxique la proposition entrée à l'internaute, voir comment les mots s'articulent, pour déterminer le sens exact de la recherche. Plutôt que de saisir des mots disparates, on posera donc sa question sous la forme d'une phrase complète.

En proie à la montée en puissance de Google, notamment sur le marché américain ou ses parts sont passées de 7,6% en mai 2007 à 5,9% en mai 2008 (chiffres Hitwise), Microsoft tente un pari sur l'avenir, dans la mesure où l'intégration des technologies développées par Powerset à MSN Search - Live Search ne se fera vraisemblablement pas sans heurts et, surtout, pas avant plusieurs années.

A lire également

Rêve de linguiste, la recherche en langage naturel peut désormais être testée par les internautes sur les contenus de Wikipedia par l'intermédiaire d'un outil conçu par la société Powerset. Reposant sur l'interprétation de phrases construites plutôt que sur une sélection de mots clé et d'opérateurs booléens, la recherche en langage naturel est censée permettre de s'adresser à un moteur de recherche comme on parlerait à un interlocuteur.

Soutenu par Tim Berners Lee, l'un des pères fondateurs du Web actuel, le principe de "recherche naturelle" consiste à analyser de façon sémantique et syntaxique la proposition entrée à l'internaute, voir comment les mots employés par l'internaute s'articulent, pour déterminer le sens exact de sa recherche. Plutôt que de saisir des mots disparates, on posera donc sa question sous la forme d'une phrase complète.

"Contrairement aux autres moteurs de recherche, qui indexent des mots clé, Powerset effectue une analyse linguistique des phrases qu'il est amené à lire", explique la firme dans un communiqué. Autrement dit : comprendre le sens des mots au lieu de simplement repérer leurs occurrences dans d'éventuelles pages de résultat.

En gestation depuis plus de deux ans, le projet de Powerset lui a valu l'attention des plus grands tels que Google ou Microsoft qui, selon la rumeur, aurait envisagé de racheter cette société fondée en 2005 et basée à San Francisco. Cantonné aux pages anglophones de Wikipedia, Powerset offre effectivement des résultats différents de ceux que retournent un moteur traditionnel, et se révèle très efficace sur certaines requêtes. En ira-t-il de même lorsque Powerset tentera d'indexer l'infinie variété des pages présentes sur le Web ?
Selon le magazine All Things Digital, le site de micro-blogging Twitter serait en pleine discussion avec Microsoft d'un côté et Google de l'autre. Les deux géants souhaiteraient en effet conclure un partenariat leur permettant de tirer profit de la multitude des données mises en ligne par les internautes (les fameux « tweets »). Ces données seraient directement intégrées au sein de leurs moteurs de recherche pour retourner des résultats en temps réel. Les publications de Twitter permettraient par exemple de retourner des réponses plus précises à une question formulée par un internaute.

De son côté Twitter recevrait un versement de « plusieurs millions de dollars » ainsi qu'une part sur les revenus publicitaires générés par les moteurs de recherche. Pour Twitter il s'agit en effet de trouver un modèle économique stable. Selon les sources proches de cette affaire, ce partenariat ne serait pas exclusif, Twitter ne souhaitant pas perdre son indépendance en réservant cette offre à un acteur du marché en particulier. Cela signifie donc que Google et Microsoft pourraient tout deux mettre en place cette technologie. La firme de Redmond avait d'ailleurs tenté l'expérience en créant bingtweets.com en partenariat avec Federated Media.

En juillet dernier Carol Bartz et Steve Ballmer ont signé un partenariat de 10 ans au travers duquel Microsoft pourrait profiter de la technologie de Yahoo! pendant que ce denier remplacerait son moteur par Bing. Si cet accord aboutit l'on peut donc se demander si la firme de Sunnyvale sera en mesure d'en profiter. Yahoo! a déjà implémenté les résultats de Yahoo! Questions / Réponses pour dynamiser son moteur de recherche.

Rappelons que d'autres rumeurs spéculaient également sur un éventuel partenariat entre Bing et Wolfram Alpha afin d'intégrer au sein du moteur une technologie de recherche sémantique plus poussée.

Commentaires

Ecrire

Ecrire un message

Votre message vient d'être créé avec succès.
LoadingChargement en cours