2011年4月13日水曜日

ページ内からリンクの貼られている画像だけを保存する方法

require 'rubygems'
require 'nokogiri'
require 'open-uri'

url = 'http://yahoo.co.jp'

doc = Nokogiri.HTML(open( url ))
doc.css('a').css('img').each do |f|
img_url = f.attribute('src').value
puts img_url
filename = File.basename(img_url)
open(filename, 'wb') do |file|
open(img_url) do |data|
file.write(data.read)
end
end
end


ちなみに純粋に画像だけを取得するなら、
doc.css('img').each do |f|
に修正すればいい。




参考:
http://d.hatena.ne.jp/gan2/20080531/1212227507

0 件のコメント:

コメントを投稿