News WEB

Malgré le retard pris par le projet Quaero, Exalead a décidé de se lancer seul sur le segment des moteurs de recherche "vidéo". A l'instar de Yahoo Video, le crawler d'Exalead identifie les pages contenant une vidéo sur les grandes plates-formes d'hébergement (YouTube, DailyMotion, Kewego, MetaCafé, iFilm, etc.) et indexe mots-clefs, tag et description pour simplifier leur recherche ultérieure.

"Les métadonnées accompagnant les vidéos sont traitées et surtout harmonisées. L'utilisateur peut classer les résultats selon 5 critères : pertinence, fraicheur, note, durée ou encore popularité. Chaque résultat présente une vignette issue de la vidéo, sa longueur et la date d'upload, le nom de l'internaute qui l'a uploadée ainsi que l'étoilage reflétant la note attribuée par les internautes", précise François Bourdoncle, PDG d'Exalead.

Malgré l'absence d'indexation de la piste audio ou de technologie de reconnaissance des images, ce nouveau Exalead Vidéo - qui revendique déjà un index de plus de quatre millions de fichiers - devrait séduire des internautes souhaitant réaliser des recherches exhaustives de fichiers audiovisuels, un terrain sur lequel travaille Microsoft en partenariat avec Blinkx mais dont est paradoxalement absent Google puisqu'il n'indexe, pour le moment, que les fichiers hébergés sur ses propres serveurs Google Video et YouTube.
Selon une étude sur le comportement des internautes, 78% des utilisateurs sont d'abord attirés par du texte; ils consacrent aussi plus de temps au texte, et s'en souviennent mieux.

improvetheweb (améliorez le Web, en anglais), propose alors de réduire la quantité d'images dans les sites, d'attirer le visiteur avec une seule grande image et des titres percutants. Une lecture édifiante.

- Use text instead of graphics on your website
Fait du mois: la croissance de Ruby se termine

PHP reste solidement 4eme, derrière Java, C, C++.

Le TIOBE Programming Community index donne une indication de la popularité des langages de programmation. L'index est mis à jour une fois par mois. Les scores sont basés sur la disponibilité mondiale d'experts, de formations et de revendeurs. Les moteurs de recherches Google, MSN et Yahoo! sont utilisés pour calculé ces scores. Notez que TIOBE index n'est pas un concours du meilleur langage de programmation ou du langage qui a le plus de lignes écrites.

- TIOBE Programming Community Index for May 2007
Avez-vous remarqué que les applications Web sont rarement compatibles entre elles? On s'en aperçoit le jour où on veut utiliser sur le même site deux applications distinctes : qui va gérer les comptes utilisateurs? où placer les templates sans les dupliquer? Comment partager une configuration commune? Et qui se charge d'initialiser le tout au lancement?

La politique générale des applications est 'n'intégrez pas notre application dans la votre, mais le contraire', ou bien 'modifiez simplement les gabarits'.

Matthew Weier O'Phinney, à la suite de Clay Loveless, se plaint de cette pratique généralisée, et propose plusieurs idées pour améliorer l'intégration entre les applications.

- Start Writing Embeddable Applications
- Stop Writing Loner Applications
Les attaques XSS prennent des formes variées, et s'appuient sur toutes les faiblesses du code. Traditionnellement, on s'en protège avec htmlentities() ou htmlspecialchars(), mais cela suppose même que la balise a utilise des guillemets pour protéger les attributs. Autrement, le caractère espace sera ignoré par les fonctions de protection, mais devient un attribut séparateur pour HTML.

C'est le même problème que mysqli_escape_string() qui ne reconnait pas les pourcentages ou les parenthèses, alors que ces derniers peuvent engendrer des dénis de services avec la balise LIKE ou une sous-requête.

- Non-Standard HTML Fuels XSS Attacks
L'illustre navigateur Web des années 90 devrait bientôt signer son grand retour. AOL devrait effectivement publier prochainement la version 9 du navigateur Web Netscape. Véritable navigateur à succès aux balbutiements d'Internet, Netscape n'a pas résisté à l'arrivée et à la démocratisation d'Internet Explorer et de Mozilla Firefox. Afin de redorer son blason, l'arrivée de cette version 9 devrait signer un retour aux sources. Ainsi, le nouveau navigateur ne devrait pas s'appeler Netscape 9, mais bien Netscape Navigator 9, comme à l'époque des premières versions du logiciel.

Contrairement aux autres versions de Netscape Navigator, Netscape Navigator 9 ne devrait intégrer qu'un navigateur Web. Le client email et l'éditeur de pages Web ne seront donc pas présents dans cette nouvelle mouture. Netscape Navigator 9 devrait utiliser le moteur de Firefox et sera disponible à la fois pour Windows, Mac OS X et Linux d'ici la fin de l'été.
le 07/05/2007 à 13:32
Les microformats
Web 2.0 a ses aspects positifs et négatifs. Outre les progrès technologiques frénétiques, l'Ajax, le contenu organisé sémantiquement et la popularité grandissante des fichiers RSS, le terme "Web 2.0" n'a toujours pas réussi à renouveler le Web au dela d'une révolution technologique.

Un des termes à l'horizon est Microformats (parfois abrégés en µF ou uF) : des formats qui rendent possible la création de méta données, qui peuvent être lues mais aussi comprises par les machines (ce qui est la base du Web sémantique, et n'est pas Web 2.0). Cet article vous donne une idée ce que c'est, de leurs avantages et de leur utilisation pour enrichir votre contenu, et le rendre plus accessible aux moteurs de recherche.

- Microformats: What They Are and How To Use Them
- Del.icio.us microformats
- Microformats : Méta-données pour les humains et les machines
Microsoft aurait-il décidé d'apprendre de ses erreurs passées ? Alors que plus de cinq années ont séparé la sortie d'Internet Explorer 6 de l'apparition de la version 7, l'éditeur de Redmond entend désormais mettre à jour son navigateur à une fréquence minimum de deux ans. IE8 pourrait donc être publié avant la fin de l'année 2008. Les objectifs annoncés sont, comme à l'époque d'IE7, une sécurité toujours plus importante, une plus grande simplicité d'utilisation ainsi qu'une meilleure prise en charge des standards du Web.

Autre contrainte, non avouée celle-ci : la nécessité de ne pas laisser Firefox, le navigateur de la fondation Mozilla, prendre une trop grande longueur d'avance. On attend en effet la première version bêta de Firefox 3 pour le mois de juillet 2007.

D'après Chris Wilson, responsable des développements d'Internet Explorer, la version 8 devrait apporter une meilleure prise en charge des spécifications CSS 2.1 (feuilles de style). Elle devrait également se montrer plus respectueuse des standards du Web, ce qui ravirait les développeurs de sites. Un dilemme se pose toutefois : comment concevoir une mouture d'Internet Explorer conforme avec les recommandations du W3C sans casser la compatibilité avec les sites conçus pour les précédentes versions du navigateur ?

Les technologies asynchrones de type AJAX sont également au coeur du développement d'IE8, tout comme l'amélioration de la gestion des flux RSS et des différents protocoles de syndication de contenus. Microsoft évoque également la prise en charge des microformats qui sont, pour simplifier, un ensemble de nouvelles balises destinées à la formation d'un nouveau xHTML sémantique. Ces microformats devraient pouvoir être interprétés par Firefox 3. Enfin, Microsoft envisage de laisser la possibilité à l'internaute de personnaliser Internet Explorer.
La fondation Mozilla continue de rameuter des grands noms de l'industrie informatique et de l'Internet mondial autour de son navigateur phare : Mozilla Firefox. Ainsi, après avoir notamment proposé une extension directement liée à un service Web de Kodak, la fondation s'associe au célèbre service d'enchères eBay.

Ce nouveau partenariat a d'ores et déjà donné naissance à une nouvelle extension pour Firefox baptisée "Firefox Companion pour eBay". Proposée en version beta, cette extension permet de rester connecté et identifié sur ebay en permanence. Il est ainsi possible de consulter les affaires en cours à tout moment. L'extension permet de personnalisez ses alertes afin de ne manquer aucune enchère et d'être averti lorsqu'une enchère qui vous intéresse est sur le point de s'achever.

Le "Firefox Companion pour eBay" s'appuie également sur une technologie antiphishing afin de détecter et d'éviter les sites frauduleux qui s'appuie sur le design du site de eBay.

- Télécharger l'extension
Jusqu'à présent il n'était pas vraiment possible d'empêcher les moteurs de recherche d'indexer une ou plusieurs parties d'une page web. On pouvait éventuellement se débrouiller pour générer une partie de la page avec du JavaScript, ce langage étant (pour l'instant) ignoré des moteurs. Yahoo introduit aujourd'hui la possibilité d'indiquer à son robot Slurp des zones de pages à ignorer, grâce à une classe CSS intitulée robots-nocontent.
Exemples de code

Attention il ne s'agit ni d'une balise robots-nocontent, ni d'une balise meta, ni d'un attribut (comme rel=nofollow) mais d'une classe CSS. Pour utiliser cette classe, il suffit d'attribuer cette classe à la balise qui englobe le contenu que vous souhaitez voir ignoré.

Si vous avez déjà donné un nom de classe à une balise, aucun problème, il suffit de cumuler plusieurs classes en les séparant par un espace.

Yahoo précise bien que dans son index, toute la page est référencée, avec tous les mots. Par contre, les mots situés dans les blocs robots-nocontent ne sont pas exploités pour la recherche et ne peuvent pas non plus être utilisés (par Yahoo) pour créer le descriptif de la page dans les résultats de recherche (snippet). C'est donc bien différent de la balise meta robots noindex qui indique aux moteurs qu'ils doivent ignorer l'intégralité de la page.

- L'annonce de Yahoo
LoadingChargement en cours