Architecture de YouTube

le 11/08/2007 à 16:08
Architecture de YouTube
Note de l'auteur :

YouTube a connu une croissance fulgurante, jusqu'à 100 millions de vidéos vues par jour, avec seulement une poignée de responsables pour assurer le développement du site.
Comment ont-ils assuré la livraison des vidéos aux visiteurs ? et comment ont-ils évolué depuis leur acquisition par Google ?

Une revue détaillée de l'architecture de YouTube, avec ses essais, ses erreurs et ses réussites.

- YouTube Architecture

A lire également

En début de semaine, trois ministères français se sont accordés à définir une charte visant à réguler la diffusion des médias sur Internet d'ici le 30 juin 2009. En matière de protection des droits d'auteur, l'institut national de l'audiovisuel (INA) dispose d'une base de signatures numériques et, au moyen d'une architecture technologique, opère une comparaison des médias avec, si besoin est, la mise en place de filtres. En février 2008, Dailymotion et l'INA ont signé des accords et le portail de vidéo français a intégré ce système de reconnaissance à sa plateforme.

YouTube vs l'INA

Avec 300 millions de visiteurs uniques mensuels, dont 12 millions dans l'Hexagone, YouTube reste le premier site Internet de diffusion de vidéos en France et dans le monde. Chaque minute, ce sont 15 nouvelles heures de vidéos qui sont mises en ligne par les internautes, un contenu que la firme californienne entend réguler. Depuis ses débuts YouTube propose une procédure de blocage pour les ayants droit, avec des outils de retrait en masse et la mise en place d'un système de filtre notamment grâce à l'usage de l'algorithme MD5.

Pourtant, aux yeux de l'INA, qui a déjà traïné YouTube devant les tribunaux pour contrefaçon, ces efforts ne seraient pas suffisants. Interrogé par les Echos, Jean-François Debarnot, directeur juridique de l'institut explique : "nous considérons que cette technologie de filtrage n'est pas opérante et nous avons saisi un juge pour qu'il le constate".

YouTube a donc revu son système de protection introduit en octobre 2007 et présente le service Content Manager, une solution gratuite similaire à celle de l'INA mais propriétaire. Pourquoi Google n'a-t-il pas signé de partenariat avec l'INA ? "Il est difficile d'établir ce genre d'entente alors que nous sommes devant les tribunaux ", explique Eric Tholomé, directeur du département Recherche et Développement de la multinationale. A cet argument, l'on pourrait ajouter que s'il est gratuit pour les ayants droit de devenir partenaire de l'institut, ce n'est pas le cas pour les plateformes tierces telles que YouTube ou DailyMotion.

Pour Eric Tholomé "la vrai problématique, c'est de savoir si la personne est l'auteur de la vidéo ou non, et si elle a des droits". Il arrive aussi qu'un internaute illustre une vidéo personnelle d'un cours extrait d'un film commercial ou utilise une bande sonore protégée par des droits d'auteurs. Monsieur Tholomé souligne aussi la dimension multidimensionelle du problème avec les différences de gestion des droits à l'international et dans le temps, par exemple lorsque de vieux films tombent dans le domaine public.

Content Manager

En replaçant la société à l'état d'hébergeur, M.Tholomé insiste : "On est pas maîtres de ce qui est publié sur Internet, on essaie d'éviter les conflits". En revanche, le portail doit impérativement avoir les moyens techniques nécessaires pour procéder au filtrage. Content Manager emploie une technologie baptisée Content ID et reprend l'idée d'une base de signatures numériques et en ajoutant le savoir-faire de Google en matière de publicité sur Internet.

Lorsqu'il ouvre son compte sur Content Manager, l'éditeur bénéfice non seulement de fichiers référence sur lesquels il peut décrire les règles associées à ses contenus mais dispose aussi d'un programme publicitaire. Il est donc possible pour l'internaute de mettre en ligne l'extrait d'un film sous certaines conditions prédéfinies telles que l'affichage de publicités ou un lien vers le site Internet de l'éditeur. "La grande majorité des revendications que font les ayants droit, c'est de monétiser le contenu", nous explique-t-on, "on a des cas où les partenaires ont multiplié leurs revenus par 90" grâce à la diffusion indirecte des internautes. "De notre côté on prend la vidéo et on crée des empreintes, c'est comme une signature unique qui permettra de faire des comparaisons", explique Monsieur Tholomé avant d'ajouter "aujourd'hui, on a plus de 100 000 heures de vidéo dans notre base d'empreintes".

Outre la monétisation par diffusion, le partenaire dispose d'une palette d'outils permettant de mesurer le degré de popularité de ses vidéos et d'en tirer un profil d'audience (sexe, âge...). Interrogés sur la question de la vie privée, l'un des porte-paroles de la société nous explique : "l'information que l'on communique aux ayant droits n'est ni plus ni moins que celle qu'ils auraient pu trouver eux-mêmes en effectuant une recherche".

YouTube propose aussi un dispositif permettant la protection de contenus diffusés en direct afin que ce dernier soit rapidement sous contrôle.

A ce jour, la société annonce 600 partenaires parmi lesquels nous retrouvons les chaïnes France24 ou CBS, l'éditeur de jeux Electronic Art ou encore l'AFP et la fondation Cousteau. A l'heure actuelle, YouTube n'entend pas distribuer sa technologie mais M. Tholomé conclut tout de même : "on espère qu'à l'avenir, il y aura des technologies interoperables".
Google va-t-il ouvrir la vidéo ? Le géant du net vient en tout cas de donner un signe fort en investissant dans TheorARM, un projet d'implémentation du codec vidéo Ogg Theora optimisée pour les processeurs ARM. Le blog de Google dédié à l'open source explique que bien que le HTML 5 offre un standard pour le web en matière de lecture de vidéo, les éditeurs de navigateur ont été incapables de tomber d'accord sur un codec unique. Si le H.264 a la faveur de certains grâce à sa qualité de compression réputée supérieure, il est coûteux en terme de licences, contrairement à Ogg Theora.

Google Chrome prend les deux codecs en charge pour l'heure, mais l'entreprise a refusé d'offrir des flux compatibles Theora sur Youtube, où son lecteur HTML 5 utilise le H.264. Au cours d'une discussion sur les codecs vidéo l'année dernière, un dirigeant de Google a même indiqué qu'aucune mesure n'était envisagée pour offrir des solutions aux navigateurs n'utilisant que Theora. Une mesure sur laquelle le géant pourrait revenir, suite à cet investissement dans TheorARM.

Jusqu'ici, l'architecture de processeurs ARM, très utilisée sur les appareils mobiles, était un frein majeur au développement de Theora. Le N900 de Nokia, le Nexus One de Google, l'iPhone et l'iPad : autant de téléphones dont le système d'exploitation est basée sur les processeurs ARM, incapables de lire le codec Theora. Avec le projet TheorARM, ce problème est résolu, et c'est peut-être ce qui a décidé Google à investir dans le projet.

Commentaires

Ecrire

Ecrire un message

Votre message vient d'être créé avec succès.
LoadingChargement en cours