2019年10月31日木曜日

国会図書館の書籍の全文テキストデーターベース化を望みたい

朝目覚めた後、しばらくは寝床でTwitterやFacebookをのぞいたり、読みかけの本を読んだりする。起床時間になると、大抵はまず用足し。尾籠な話だが、ここでは集中できるので、前夜の夕刊をじっくり読む。夕刊には、暇人向けの記事が多い。今朝見つけたのは、森鷗外の全集未収録の文章が出てきたという記事だ。『新纂診斷學』という1891年の医学書の序文だとか。
思い立って、朝食後、『新纂診斷學』を国会図書館で探してみたら、すぐ見つかった。
http://dl.ndl.go.jp/info:ndljp/pid/834380



インターネット公開扱いなので、誰でも読める。ただし、森鷗外または森林太郎という名前からは検索できない。彼は序文を書いただけなので。

Internet Archiveや外国の大手図書館の蔵書なら全文検索ができるようだから、このようなことにはならないだろう。
日本でも、古書→OCR→全文テキスト化をもっと行うべきだと思う。大蔵経など、個別のものは出来つつあるので、金をかけさえすればできると思うのだが。クラウドファンディングでやってみるか?いくらくらい掛かるのか、見積もりをしてみたい。

***
『きのこのなぐさめ』は、読み終えた。最後の方で、マジックマッシュルームによりみちしそうになるが、なんとか思いとどまったらしい。癒やしという面で考えると、当然のよりみちであろう。
最終的に、作者は100パーセント立ち直ったわけではないが、新しい世界に行動範囲を広げたので、相対的に元気になったし、質の違う楽しみを手に入れたことになる。
この本に書かれた記録は、多くの人の参考になるだろう。そういう意味で大切な本だと思う。
私だったら、きのこではなく、ある種の書籍だったり、昆虫だったり、宇宙の星だったりするかも知れない。

0 件のコメント: