frame_decoration

The Small Issue(スモール・イシュー)

スリーパーズ日記


「パブリックドメインのデジタル復刻といえば青空文庫だけれど、そこでさえ、現代表記版への変換登録数はごく少ない。作業に醍醐味を感じる理由のひとつは、そのあたりかもしれませんね」

 キーワード「現代表記」で『青空文庫全』収録作品を検索すると、255件ほどのヒットがある。その多くが、大久保ゆうくん率いる京都大学電子テクスト研究会による入力・校正。『青空文庫全』収録総タイトル数が6612件だから、4%弱ということになる。

 なぜ「現代表記版への変換に醍醐味を感じる」のかというと、現代表記テキストであれば、点字への変換や、音声読み上げ、機械翻訳というような展開が容易になるから。旧字旧かなのテキストでもまったくの不可能ではないにしても、事前に表記の変換をすませておけば、読み上げや翻訳の精度が高くなることが予想される。

 Google や国会図書館・各大学図書館等で書籍の画像スキャンが進行しており、OCR(文字認識装置)の精度とスピードが高まれば、多量のデジタルテキストが供給されることになる。けれども、広く公開可能なのはパブリックドメインに該当する(=著作権保護期間を経過した)作品に限られる。自然、国内では旧字旧かなのままのテキストが多く対象となる。研究者への提供ならそれでもいいが、それ以外の利用者を望むならば、現代表記への変換作業をはさむ・はさまないで大きく利用数が増減してくる、はず。

 国立国会図書館、National Diet Library(http://www.ndl.go.jp/jp/data/endl.html)によれば、近代デジタルライブラリーは 2009年(平成21年)8月現在で約156,000冊が公開されているという。仮に10人で現代表記への変換にあたると、一人あたり15,600冊。100人でも一人1,560冊。仕事がないといわれる昨今、パブリックドメインの現代表記への変換作業は、しばらく食いっぱぐれのないほど仕事がある。あとは、それを「なりわい」として継続できるようなしかけがあればいい。『週刊ミルクティー*』はそのための一つの試み。引きこもり脱出のための The Small Issue。

 ところで、現代表記版だけがあればいい、とは思わない。むしろ、どこをどのように変更したのか変更部分を確認するためにも、やはりオリジナル(=底本)に忠実な版の公開もまた並行してすすめるほうが好ましいと思う。どこをどう変更したのか、変更部分を機械的にチェックする方法はあるだろうから、変更履歴を手作業で作成・添付する必要はかならずしもなくていい。

「青空文庫は慢性的な人材不足だから」という意見をときおり見かける。先日のそらもようでも、富田さんが「校正者不足は、スタート当初から青空文庫が抱えている課題だ」と書いている(http://www.aozora.gr.jp/soramoyou/soramoyouindex.html、2010年01月18日「トレンドイーストによる校正支援」)。かつて、「ボランティアが600人もいて、名前も知られて成功している青空文庫が人材不足というのはおかしいんじゃないか」と、ある人に指摘されたことがある。指摘されてハッとした。ぼくもそう思う。すでに600人も工作員がいて、まだたりないというならば、あとどれだけ工作員が増えれば充分といえるのか。「不足だ、不足だ」ということばが口ぐせになっているとすれば、食っても食い足りないカオナシやハウルの動く城状態にあることを自覚したほうがいいように思う。

 無料で本を読みたいのであれば、近くの図書館でもじゅうぶんに読める。だから「無料で本を読める」ということは青空文庫の魅力のうちの1/4でしかない。青空文庫の大きな魅力はそれ以外のところにある。工作員として入力・校正作業をおこなうことも魅力の1/4であろうし、本好きの工作員どうしが出会ってメール交換しあって、10年来、世話役のひとたちと交流できたことも1/4の魅力。目くそ鼻くそも多少の縁。そして残りの1/4の魅力は、当の工作員も外部の人もまだ気づいていないところにひそんでいる、と思っている。



2010.1.21:公開
しだひろし/PoorBook G3'99
翻訳・朗読・転載は自由です。
カウンタ: -

  • 「青空文庫を支える人々(http://www.aozora.gr.jp/workers.html)」によれば(最終更新日)2009年10月19日現在、青空工作員は664人。 -- しだ (2010-01-29 10:13:58)
名前:
コメント:
最終更新:2010年01月29日 10:13