Google : des résultats de recherche en temps réel

le 08/12/2009 à 23:24
Google : des résultats de recherche en temps réel
Indexer vite, c'est bien ; le temps réel, c'est mieux. Google a présenté lundi via l'un de ses blogs une fonctionnalité visant à conférer à son moteur de recherche la possibilité d'afficher en temps réel les contenus qui paraissent sur le Web à propos d'un sujet donné, qu'il s'agisse de dépêches et d'articles d'actualité ou de messages postés sur les réseaux sociaux tels que Twitter et Facebook. A première vue, cette fonctionnalité pourrait paraitre anecdotique. A sa façon, elle marque peut-être un cap dans le rapport qu'on entretient avec l'information.

Par un beau mardi de décembre, je marche sur les Champs Elysées quand soudain, j'aperçois au loin un attroupement de plusieurs centaines de personnes. Pressé par le temps, je n'ai pas le temps de m'approcher, pour voir ce qui motive cette manifestation mais la curiosité me taraude. Si je veux savoir immédiatement ce qui se passe, je n'ai d'autre choix que de me tourner vers un moteur de recherche et de procéder par tâtonnements.

Si l'événement a été annoncé dans la presse ou sur les blogs, je trouverai sans doute mes réponses grâce à un outil dédié à l'actualité, mais le cas échéant ?

Avec la recherche en temps réel, il me suffirait de taper "manifestation Champs Elysées" pour qu'apparaisse, dans un emplacement dédié, les occurrences les plus fraiches de ces termes parus sur Internet. Un message Twitter peut-être, ou un statut Facebook, d'un des participants, qui aura indiqué, trente secondes avant que je lance ma recherche : 500 personnes font la queue pour l'ouverture du magasin XZZ. Je ne connais pas l'auteur de ce message, et ne l'aurai pas pas trouvé sans un outil global, capable de mixer tous les flux d'informations existants.

Telle est la promesse théorique de cette recherche en temps réel, que Google s'apprête à tester, d'abord sur la version américaine de son moteur de recherche. Une fonctionnalité similaire a déjà été mise en place par Microsoft sur Bing aux Etats-Unis, mais elle ne prend en compte que Twitter. Google pense plus global et, surtout, intègre ce « Web en temps réel » à ses pages traditionnelles de résultats, sous la forme d'un cadre placé en haut de page, dont les contenus seront automatiquement rafraichis.

« Notre fonctionnalité de recherche en temps réel est basée sur une douzaine de nouvelles technologies qui nous permettent de suivre plus d'un milliard de documents et de procéder à des centaines de millions de changements en temps réel, chaque jour », affirme le moteur, qui précise en outre que ce déploiement n'aurait pas été possible sans le concours de services tels que Facebook Friendfeed, Jaiku, Identi.ca ou Twitter, avec qui un partenariat a été annoncé il y a quelques semaines (voir Yahoo! se rapproche de Facebook, Google de Twitter).

Google espère ainsi faire tomber l'un des principaux défauts de la recherche sur le Web : le délai d'indexation des pages. Par extension, il éliminerait donc le besoin de se tourner vers des outils dédiés à tel ou tel type d'information, en mélangeant flux personnels émanant des réseaux sociaux et actualités traditionnelles, publiées par les médias et les agences.

A lire également

L'incubateur idealab lance une nouvelle start-up baptisée TweetUp. Son but : appliquer le même modèle qu'Adsense aux flux d'informations Twitter, pour monétiser le service. Derrière idealab, il y a Bill Gross, fondateur d'Overture Services. Cette entreprise, rachetée par Yahoo! en 2003, s'appelait avant GoTo.com, et était le premier service effectif de liens sponsorisés. Donc de la publicité en ligne telle qu'on la connait aujourd'hui.

TweetUp va donc permettre aux utilisateurs de Twitter d'enchérir sur des mots-clés, pour que leurs messages apparaissent en premier dans les résultats d'une recherche. Le service offrira également un classement des twitts en fonction de leur popularité. Celle-ci sera calculée en fonction du nombre de retweets (le nombre de fois qu'un message a été republié par l'auditoire d'un utilisateur), et du nombre de clics sur les liens qu'un message contient. C'est l'entreprise Klout qui fournira les données pour l'algorithme de classement, et Bit.ly, un raccourcisseur d'URL, qui fournira les taux de clics sur les liens.

Bill Gross annonce qu'il a déjà signé plusieurs accords commerciaux avec des services tiers de Twitter, comme Seesmic, TwitterFeed, et Twidroid, pour que la méthode de classement de TweetUp soit utilisée sur ces outils. Le site Twitter.com ne serait donc pas concerné directement, en tous cas pas tant qu'un accord éventuel n'a pas été établi. Autres partenariats : une barre de recherche devrait apparaître sur des sites Internet, comme BusinessInsider.com et Answers.com. Selon Bill Gross, les revenus générés seront répartis avec tous les partenaires.

Le but - outre la monétisation du service - est de trier les messages lors d'une requête sur un mot-clé. Des milliers de messages apparaissent généralement, avec une mise à jour en temps réel parfois difficile à suivre. Chez TweetUp, « on trouve que Twitter est incroyablement puissant, mais qu'il est incroyablement compliqué de trouver les twitts intéressant au milieu du bruit ambiant. » TweetUp a levé 3,5 millions de dollars via un groupe d'investisseurs, dont Index Ventures, et Revolution, le fonds de l'ancien président d'AOL Time Warner, Steve Chase. C'est la personnalité de Bill Gross lui-même, et son rôle dans le développement d'outils de monétisation avec GoTo.com, qui aurait convaincu Steve Chase : « TweetUp est à Twitter ce que Google est au web », précise-t-il.

Techniquement, Bill Gross explique son service par « la possibilité d'enchérir sur des mots-clés, comme iPad ou énergie solaire, pour propulser leur profil Twitter ou leurs posts en haut des classements TweetUp. » Les enchères débutent à 1 centime de dollar, et les gens devront payer à chaque fois que leur profil ou leur post apparaissent dans une recherche. Bill Gross estime qu'à terme, « toute personne qui voudra se constituer une audience paiera. » L'entrepreneur explique qu'il a eu l'idée au cours de la Conférence de Copenhague, et l'a concrétisée après les conférences TED en février : après avoir lu 10 000 twitts sur le sujet, il s'est rendu compte que « seuls 200 à 300 étaient intéressants. J'ai pensé qu'il serait bien de pouvoir filtrer le contenu pour les faire ressortir du lot. » Il a conclu ses premiers accords commerciaux à cette même conférence.

Reste à voir ce que fera Twitter. Le service de micro-blogging cherche une voie de monétisation depuis longtemps, et pourrait réagir rapidement à l'annonce de TweetUp. Car le service de Bill Gross pourrait couper l'herbe sous le pied de Twitter, en ne favorisant pas forcément l'utilisateur final. Plusieurs questions restent en suspens : quelle sera la place des twitts sélectionnés par l'algorithme pour leur pertinence face à ceux monétisés ? Si un système comme celui de Google est utilisé (résultats sponsorisés indiqués avant les résultats classés par l'algorithme, et clairement identifiés comme sponsorisés), n'y a-t-il pas le risque que les utilisateurs ne les lisent même pas ? Bill Gross n'a pas encore apporté de précisions sur ces points. Twitter pourrait donc choisir de lancer son propre système de monétisation plutôt que de partager avec TweetUp et ses partenaires. Cette piste est appuyée par la récente stratégie de déploiment de clients officiels sur les smartphones, au détriment des clients tiers privilégiés par TweetUp.
Par l'intermédiaire de son blog destiné aux éditeurs de sites Web, Google appelle cette semaine les professionnels du Web à tester avec lui une nouvelle mouture de son moteur de recherche. Cette démarche est présentée comme l'aboutissement de plusieurs mois de travaux, pendant lesquels ses ingénieurs ont collaboré à la mise au point d'une architecture de nouvelle génération visant à supporter le fonctionnement du moteur : de l'indexation des pages Web à la restitution des résultats en passant par les calculs nécessaires au classement de ces derniers. Nom de code : Caffeine.

« Cette nouvelle infrastructure se cache sous la capot, ce qui signifie que la plupart des utilisateus ne constatera aucune différence dans les résultats de recherche. Les développeurs Web et les spécialistes de la recherche devraient toutefois observer quelques changements, ce qui nous conduit à ouvrir cette période de tests pour collecter leurs retours », explique un billet cosigné par Matt Cutts, l'un des principaux ingénieurs impliqués dans le projet.

Si l'internaute ne retient généralement d'un moteur de recherche que sa simplicité d'utilisation et la pertinence des résultats, les professionnels du Web savent bien qu'une gigantesque infrastructure, particulièrement complexe, sous-tend l'ensemble : une mécanique pointue, objet d'incessants réglages, qu'il faut de temps à autres remanier en profondeur, sans que la surface en soit visiblement affectée.

Google se garde bien de préciser s'il souhaite profiter de cette nouvelle infrastructure pour faire évoluer le classement des résultats au sein de son moteur, se contentant d'affirmer qu'elle lui permettra d'augmenter sa vitesse d'indexation et ses prétentions à l'exhaustivité. Quelques rapides essais, effectués en comparant l'actuel Google à cette version de test permettent d'observer de légères différences de classement, qui sur des faits d'actualité, laissent penser que leur traitement pourrait se voir accorder une place plus importante. Une orientation qui reste à confirmer, mais cette « caffeine » pourrait être une façon pour Google de se réveiller face aux ambitions affichées par Bing, Yahoo ou des réseaux sociaux tels que Facebook ou Twitter dans le domaine de la « recherche en temps réel ».

Exemple ci-dessous avec une requête sur le terme Iran, qui retourne 173 millions de résultats sur la version standard de google.com (à gauche), contre 220 millions sur cette version de test (à droite).

Commentaires

Ecrire

Ecrire un message

Votre message vient d'être créé avec succès.
LoadingChargement en cours