2014年8月12日、スミソニアン協会が、デジタル化した資料をクラウドソーシングでテキストデータ化するためのウェブサイトを公開し、協力を呼びかけています。
手書きの日記や文書の文字は機械で読み取ることが難しく、人手による解読が必要になるとのことです。デジタル化画像の文字をテキストデータ化し、検索できるようにすることで、さらなる研究や発見の機会をひらくことを目的としているとのことです。
同協会では、この1年間で、1,000近くのボランティアと試行を行い、13,000ページ以上のテキストデータ化を完了したとのことです。
Volunteers Needed for Massive Smithsonian Digitization Project – New Website Allows Anyone with Internet Connection to Help(Smithsonian, 2014/8/12)
http://newsdesk.si.edu/releases/volunteers-needed-massive-smithsonian-digitization-project
Transcription Center
https://transcription.si.edu/
参考:
スミソニアン協会、“Smithsonian Commons”のプロトタイプを公開
Posted 2010年6月23日
http://current.ndl.go.jp/node/16408
NDLラボで「翻デジ」バージョン0.8が公開:近代デジタルライブラリの資料を共同でテキストデータ化するためのプラットフォーム
Posted 2014年3月26日
http://current.ndl.go.jp/node/25768