Google は現在、いろんな大学と提携して、図書館内のテキストの電子化に取り組んでいて、成果は Google Book Search という形で現れている (いろいろと物議を醸し出してはいるけれど ^^;)。その Google Book Search に、著作権の切れた本を PDF で丸ごとダウンロードする機能が付いた。
- Inside Google Book Search: Public domain treasures -- now available for downloading
- Official Google Blog: Download the classics
PDF 版の利用は、Google Book Search の検索ボックス下にあるラジオ・ボタン「full view books」にチェックを入れて検索するだけ。いくつかの書籍が検索結果に現れるので、求める書籍をクリック。すると、PDF 化されたテキストが表示される。ダウンロードは、右カラム上方の「download」ボタンから。
例えば、Robert Browning の有名な詩の一節 "God's in his heaven" を検索してみませう。
検索結果には、Putman's Monthly (1857)、Poems (1863)、A Life for a Life (1859) の三冊が表示される。欲しいのは、Robert Browning の詩なので、1863 年の Poems をクリック。すると、この一節を含む Pippa Passes が全文表示された。右カラム上方には、「Download PDF - 12.5M」とリンクが出ている。つまり、このリンクからダウンロードが可能。
ダウンロードした PDF の閲覧には、Windows なら Adobe Reader 7 以降か Foxit Reader。Linux なら xpdf か GPL Ghostscript 8.54 以降が必要らしい。
レビュー記事は以下の通り。
- TechCrunch Japanese アーカイブ » Google、著作権切れ書籍のpdfダウンロード開始
- Seven Degrees: Googleが古典小説などを無料でダウンロード可能に
- Google Operating System: Download Public Domain Books From Google
- » Google Enabling Free Downloads Of Old Books » InsideGoogle » part of the Blog News Channel
- Google offers free book downloads - Lifehacker
なお、著作権切れのテキストを配布するサイトとしては、
などが有名。
Google Book Search がこれらのサイトより優れている所は、検索性の高さかな。
Googleの方は画像pdfのようなので、typoがない。
ReplyDelete逆に青空文庫等は完全にテキストなので加工等がし易い。
Sekizaka さん、コメントありがとうございます。
ReplyDeleteGoogle Booksearch の PDF が画像ベースである点は、確かに重要ですね。typo がないという指摘は、目から鱗でした :)
Googleのミリオンブックスプランは衝撃的です。毎日10万頁以上スキャンされているそうです(クーリエヤーポンの記事から)
ReplyDelete私も3冊ダウンロードして少し読んでみて
放置しています(悲)
PDFなのでダウンロードしたらテキストより
1桁大きい。
青空文庫だと電子辞書に入れると縦書きを
横書きにと自由に変換できます。それとやはり日本語なので早く読める。
しかし私はGoogleのいろんなサービスの中でもかなり気に入っていますし、Google的
だと感じています。
ミリオン・ブックス・プランについては、初めて知りました。一日 10 万頁ですか。すごいですね。あとは、日本の本も早く充実させて欲しいものです。
ReplyDelete私は、古い詩集 (ロバート・ブラウニングとか) を Google Book Search で読んでいます。古典に簡単にアクセスできるのはいいですね。