風柳メモ

ソフトウェア・プログラミング関連の覚書が中心

白泉社「楽園」web増刊の画像をダウンロードするやり方

「楽園」web増刊はしばらくすると消されてしまう…

なので、
「楽園」第12号のときのweb楽園作品一覧
から、例えば「ヴァーチャル・レッド」を取得しようとしても、「404 Not Found」になってしまう。
できれば、消される前に、手元に保存しておきたい。

少し調べてみたところ…

例えば、「Dear Future」の場合、

  1. 本のURL
    http://www.hakusensha.co.jp/rakuen/vol13/trial/1224_shigisawa/_SWF_Window.html
  2. 本の情報が入った book.xml のURL
    http://www.hakusensha.co.jp/rakuen/vol13/trial/1224_shigisawa/books/db/book.xml
  3. 1ページ目の画像URL
    http://www.hakusensha.co.jp/rakuen/vol13/trial/1224_shigisawa/books/images/2/1.jpg
  4. 最終ページの画像URL
    http://www.hakusensha.co.jp/rakuen/vol13/trial/1224_shigisawa/books/images/2/22.jpg

となっていた。

どうやら、"_SWF_Window.html"があるディレクトリのPATHを<base>とすると、

  • book.xmlのURL
    → <base>/books/db/book.xml
  • 画像のURL
    → <base>/books/images/<種別>/<番号>.<拡張子>
    • <種別> → 1: 小さい画像、2: 大きい画像、t: サムネイル
    • <番号> → 画像の番号(連番)(サムネイルの場合、g_1 などとなる)
    • <拡張子> → 画像形式(jpg等)

となっているらしい。

で、<番号>や <拡張子> 等の情報については、book.xml の中身を解析すればよい。
というわけで、第13号時の作品については、自動取得するスクリプトを組んで、全てローカルに保存しておいた。


追記

検索してみたら、こんな記事を見つけた。

ミニマリスト宣言: [Programming] ActiBookコンテンツをFlash無しで読むためのブックマークレット

どうやら、

ebook・電子ブック・電子書籍作成ソフトならActiBook

ActiBook という電子ブック作成ソフトで作られたコンテンツだったらしい。
なるほど、上記の自作スクリプト、それらしきサイトの電子ブック画像もダウンロードできるっぽい。もっとも、バージョン?によってはうまくいかないサイトもあるけれども…。