青空文庫について

インターネットの電子図書館、青空文庫へようこそ。

 青空文庫は、利用に対価を求めない、インターネット電子図書館です。
 著作権の消滅した作品と、「自由に読んでもらってかまわない」とされたものを、テキストとXHTML(一部はHTML)形式でしろえています。
 現在、1万2000件以上の作品が青空文庫に納められています。著作権の消滅した作品の中には、太宰治、芥川竜之介、夏目漱石といった著名な作家の作品が数多く含まれています。

参考リンク

このアプリケーションについて

 この作品は、Linked Open Data Challenge Japan 2012のアプリケーション部門に向けて作成したものです。このシステムの中では、青空文庫で公開されている作品データをRDF(Resource Description Framework)のフォーマットの一つであるJSON-LDという形式に変換して利用しています。
また、利用しているデータのスキーマ等については、同イベントのデータセット部門に投稿した青空文庫Linked Open Dataの方をご確認いただけると幸いです。

実際に利用しているデータ

  • 青空文庫の「公開中 作家別作品一覧拡充版」をJSON-LDに変換したもの:list_person_all_extended.json
  • 青空文庫の作品の最初の一文を取得し、作成したJSONデータ:text_json.json

参考リンク

お問い合わせ

筑波大学図書館情報メディア研究科 杉本・永森研究室
落合香織(HsiOji) ochiai[at]slis.tsukuba.ac.jp([at]の部分を@に直して下さい)

「ほんのまくら」って何?

「本の出だしって、すごく悩むのでしょうね。」

 「ほんのまくら」とは、本の中に出てくる最初の一文目を指します。普段、小説を読んでいても、もしかすると読者はあまり気にしていない部分かもしれない。しかし考えてみれば、歴代の名作の中には「メロスは激怒した」、「国境のトンネルを抜けると〜」など、とてもインパクトの強い出だしで始まる作品が多い気もします。
 2012年夏、紀伊国屋新宿本店では、そんな「ほんのまくら」だけをもとに小説を探すというフェアが開催されました。タイトルも著作者も分からない状態で、「ほんのまくら」と手に取る感触だけで本を選ぶという、まさに本の闇鍋です。
 私はこの「ほんのまくら」の話を聞いたとき、とても面白いと思いました。そして、実際の本屋だけでなくこれはWebでも再現できないか?と思いました。しかし、これをWebで再現するには本文の情報が必要です。そんなとき、ふと頭に浮かんだのが青空文庫でした。青空文庫には大量の著作権の切れた作品がありますし、そこには数々の名作が存在しています。また、ついつい有名な著者名をもとに探しがちで、意外に青空文庫にどんな作品があるのかをじっくり見る機会はなかなかないのではないだろうか?とも思いました。ぜひ、「ほんのまくら」in青空文庫を楽しんで頂ければと思います。

参考リンク