人気記事

広告

記事検索

MOVION.netについて

WEB技術に関することや、気になるWEBサイトなどについて個人的なメモを残すためのブログです。

その他運営サイト

かかわっているサイト

2010年10月13日(水)

wgetでページ内の画像ファイルを取得し同一ディレクトリに格納

例)
wget -nd -k -p -e robots=off -P /hoge/hoge/output/dir/ http://www.movion.net/

 オプション説明

  • -nd :ディレクトリを掘らない
  • -k   : 絶対パスなどを相対パスに変換(が、謎)
  • -p   :HTML内の画像を取得
  • -e robots=off : robots.txtを無視
  • -P 出力ディレクトリ : 指定したディレクトリに出力

最後のURLは取得するページのURLです。

ま、いまどきのサイトはこれだけでは確実に不十分です。というかwgetでは無理が有ります。(cssのimportやcss内の画像は取得してくれないので)

以下のソフトでwgetよりは多く取得できる模様。

・pavuk
http://pavuk.sourceforge.net/