Twitter n'utilisera pas Cassandra pour stocker ses tweets

le 12/07/2010 à 18:22
Twitter n'utilisera pas Cassandra pour stocker ses tweets
Le blog Engineering Twitter a dévoilé ce week-end la nouvelle stratégie de stockage des tweets par le service de micro-blogging. Et Cassandra n'est pas l'option retenue. Cette base de données NoSQL (pour Not only SQL) a été rendue publique en 2008 par Facebook, et a depuis été soutenue par des services importants du web, comme Digg. Cassandra sera toutefois utilisée pour le système d'analyses - ce qui confirme que ce produit sera bientôt lancé, même s'il n'est toujours pas officiellement annoncé.

Au départ, Twitter envisageait d'utiliser Cassandra, au détriment de MySQL, pour stocker ses tweets. Mais ce ne sera pas le cas, finalement, au moins pour l'instant.«  C'est un changement de stratégie, » explique Ryan King, l'auteur du billet sur le blog de Twitter. « A la place, nous allons continuer à maintenir notre stockage existant, basé sur MySQL. Nous pensons que ce n'est pas le bon moment pour réaliser une migration de grande ampleur vers une technologie nouvelle. » Pas le bon moment, peut-être en raison des récentes difficultés connues par Twitter pour assurer un service pérenne, en période de grande activité micro-bloggistique sur fonds de Coupe du Monde de football.

Pour autant, Cassandra n'est pas jeté à la poubelle sans autre forme de procès, puisque ce projet Apache « de base de données distribuée de seconde génération », très flexible, continuera d'être une solution clé pour les projets à grande échelle de Twitter, comme la géolocalisation des tweets avec Twitter Places, l'organisation des tweets pour les classements types Top Tweets et Trends, ou le très attendu système d'analyses. « Nous investissons dans Cassandra chaque jour. Elle restera avec nous pour très longtemps, et notre usage ne fera que croître, » précise King.

A l'état d'idée potentielle parmi d'autres selon Twitter, l'outil d'analyses pourrait bientôt faire partie de la stratégie de monétisation du site. Selon ReadWriteWeb (en anglais), plusieurs indices montrent qu'il sera lancé bientôt, et Ryan King l'a clairement dévoilé dans son billet : « Nos équipes analyses, opérations et infrastructures travaillent sur un système utilisant Cassandra pour un outil d'analyses en temps réel de grande ampleur, destiné à la fois à une utilisation interne et externe. »

Commentaires

Ecrire

Ecrire un message

Votre message vient d'être créé avec succès.
LoadingChargement en cours