mercredi, décembre 07, 2005

Comment ouvrir et regarder le contenu d'une page html

Voilà un petit script bien simple pour ouvrir une page html et recupérer les lien de type image:
require 'net/http'

h = Net::HTTP.new('www.pragmaticprogrammer.com', 80)
resp, data = h.get('/index.html', nil)
if resp.message == "OK"
  data.scan(/<img src="(.*?)"/) { |x| puts x }
end
J'adore la simplicité de ruby !
Technorati tags:

3 commentaires:

Frederick Ros a dit…

Mais aussi:

ruby -r'open-uri' -e "open('http://www.pragmaticprogrammer.com/index.html').readlines.join.scan(/img src=\"(.*?)\"/) { |x| puts x }"

Nicolas Delsaux a dit…

Le one-liner qui fait mal !

Frederick Ros a dit…

Y'a meme plus court :

ruby -r'open-uri' -e "open('http://www.pragmaticprogrammer.com/index.html').read.scan(/img src=\"(.*?)\"/) { |x| puts x }"

j'ai poste le precedent trop tot ce matin ;)