2006-09-01

Google Book Search の著作権切れテキスト PDF 化機能

Google は現在、いろんな大学と提携して、図書館内のテキストの電子化に取り組んでいて、成果は Google Book Search という形で現れている (いろいろと物議を醸し出してはいるけれど ^^;)。その Google Book Search に、著作権の切れた本を PDF で丸ごとダウンロードする機能が付いた。

PDF 版の利用は、Google Book Search の検索ボックス下にあるラジオ・ボタン「full view books」にチェックを入れて検索するだけ。いくつかの書籍が検索結果に現れるので、求める書籍をクリック。すると、PDF 化されたテキストが表示される。ダウンロードは、右カラム上方の「download」ボタンから。

例えば、Robert Browning の有名な詩の一節 "God's in his heaven" を検索してみませう。

検索結果には、Putman's Monthly (1857)、Poems (1863)、A Life for a Life (1859) の三冊が表示される。欲しいのは、Robert Browning の詩なので、1863 年の Poems をクリック。すると、この一節を含む Pippa Passes が全文表示された。右カラム上方には、「Download PDF - 12.5M」とリンクが出ている。つまり、このリンクからダウンロードが可能。

ダウンロードした PDF の閲覧には、Windows なら Adobe Reader 7 以降か Foxit Reader。Linux なら xpdf か GPL Ghostscript 8.54 以降が必要らしい。

レビュー記事は以下の通り。

なお、著作権切れのテキストを配布するサイトとしては、

などが有名。

Google Book Search がこれらのサイトより優れている所は、検索性の高さかな。

4 comments:

  1. Googleの方は画像pdfのようなので、typoがない。

    逆に青空文庫等は完全にテキストなので加工等がし易い。

    ReplyDelete
  2. Sekizaka さん、コメントありがとうございます。
    Google Booksearch の PDF が画像ベースである点は、確かに重要ですね。typo がないという指摘は、目から鱗でした :)

    ReplyDelete
  3. Googleのミリオンブックスプランは衝撃的です。毎日10万頁以上スキャンされているそうです(クーリエヤーポンの記事から)
    私も3冊ダウンロードして少し読んでみて
    放置しています(悲)
    PDFなのでダウンロードしたらテキストより
    1桁大きい。
    青空文庫だと電子辞書に入れると縦書きを
    横書きにと自由に変換できます。それとやはり日本語なので早く読める。
    しかし私はGoogleのいろんなサービスの中でもかなり気に入っていますし、Google的
    だと感じています。

    ReplyDelete
  4. ミリオン・ブックス・プランについては、初めて知りました。一日 10 万頁ですか。すごいですね。あとは、日本の本も早く充実させて欲しいものです。

    私は、古い詩集 (ロバート・ブラウニングとか) を Google Book Search で読んでいます。古典に簡単にアクセスできるのはいいですね。

    ReplyDelete