Extraire les liens d'une page - Commentaires
Mercredi 8 octobre 2008
Extraire les liens d'une page
Pour extraire les liens d'une page (ou tout autre balise, en fait), vous avez trois approches :- DOM, avec getElementsByTagName
- Xpath, avec query('//a')
- Les expressions rationnelles, avec moult solutions publiques et privées
Au final, les deux premières sont acceptables si les pages sont valides d'un point de vue XML, ce qui est encore loin d'être le cas de toutes les sites. La dernière est moins performante et élégante, mais c'est un tout-terrain. Pour le choix final, il faudra alors s'adapter.
- Get links with XPath
News proposée par : LA GLOBULE
Provenance de la news : Nexen
Dernière révision de la news : le 08/10/2008 à 23:43
Télécharger cette news au format PDF
Provenance de la news : Nexen
Dernière révision de la news : le 08/10/2008 à 23:43
Télécharger cette news au format PDFLes commentaires
Il n'y a aucun commentaire pour cette news.
Remonter 
