Je ne sais pas si vous vous souvenez, mais je vous ai déjà parlé de Scrapy, un framework capable de crawler le web et d'en extraire des données structurées qui tourne sous Windows, Mac et Linux. L'avantage de ce genre de truc, c'est de pouvoir capter des données en provenance de sites classiques pour ensuite les réutiliser dans vos propres projets.
Et bien j'ai une bonne nouvelle à vous annoncer puisque les développeurs de Scrapy viennent de mettre en ligne une première version de Portia, un outil de scrapping basé sur Scrapy qui permet de faire la même chose tout au clic, c'est à dire sans mettre les mains dans le code.
Voici une démo, ça a l'air très prometteur.
Les initiateurs du projets réfléchissent à mettre à disposition Portia pour que chacun puisse l'utiliser directement en ligne. Mais en attendant, vous pouvez récupérer les sources sur Github et l'installer chez vous pour voir ce que ça donne.
Cet article merveilleux et sans aucun égal intitulé : Portia – Un outil de web scrapping visuel ; a été publié sur Korben, le seul site qui t'aime plus fort que tes parents.
by via MyTFMRSS
No comments:
Post a Comment