Digg vient renforcer le mouvement pro-NoSQL

le 16/03/2010 à 18:15
Digg vient renforcer le mouvement pro-NoSQL
Après Google, Facebook, Amazon, LinkedIn, un autre géant du web vient de laisser tomber les bases de données MySQL. Le site Digg, qui permet aux internautes de voter pour des articles issus de médias ou de blogs, va exploiter la base NoSQL rendue open source par Facebook en 2008, Cassandra.

En quittant la base MySQL, qui l'a aidée depuis sa création, Digg a le souci d'améliorer sa performance et son évolutivité. A la place, le site va donc utiliser Cassandra, une base de données non relationnelle. Les ingénieurs de Digg ont dû pour cette opération développer un outil pour transférer les informations d'une base à l'autre, qu'ils pourraient bientôt rendre open source afin d'aider les développeurs.

Digg vient renforcer le mouvement pro-NoSQL. Créé en 2009, ce dernier peut donc se targuer d'attirer un nouvel adepte de taille. Ce type de bases non relationnelles diffère des bases traditionnelles comme MySQL dans son fonctionnement. Plutôt que d'utiliser des tableaux, des colonnes et des liens entre les deux pour fournir les données, les bases NoSQL utilisent différents types de banques de données et d'objets.

John Quinn, vice-président de l'ingénierie à Digg, explique dans un billet du 8 mars dernier avoir « longuement évalué toutes les solutions MySQL ». S'il a été intéressé par certaines, comme MongoDB, il a retenu Cassandra pour son modèle de stockage, qui a fait ses preuves avec Facebook, et la gestion de datacenters multiples. Depuis septembre 2009, Digg a testé Cassandra pour plusieurs de ses opérations. La plupart des fonctionnalités du site ont été réimplémentées depuis MySQL pour utiliser maintenant Cassandra comme base de données principale.

S'il n'est pas encore question d'évaluer le gain de performance, le modèle complètement décentralisé semble beaucoup plaire à Quinn : « Chaque noeud est identique, et il n'y a aucune faille. L'information est répliquée dans plusieurs noeuds à travers tout le datacenter. Cassandra est très tolérante aux erreurs, et très élastique. »

Ce sont ces mêmes raisons, et le dynamisme de la communauté open source autour de Cassandra, qui ont récemment fait choisir cette solution à Twitter. Selon Ryan King (en anglais), ingénieur chez cette plateforme de micro-blogging, tout le système se basera à terme sur la base NoSQL, contrairement à Digg. Malgré les performances de Cassandra, Digg n'abandonnera pas tout à fait MySQL. « Nous l'utiliserons pour des cas très spécifiques, et du prototypage rapide. MySQL assure un niveau de flexibilité que Cassandra n'a pas. C'est très utile pour les projets de petite taille. »

Commentaires

Ecrire

Ecrire un message

Votre message vient d'être créé avec succès.
LoadingChargement en cours