JSTOR、アラビア語資料のデジタル化に関するホワイトペーパーを公開

2019年8月15日、JSTORはアラビア語資料のデジタル化に関するホワイトペーパー“Digitizing Printed Arabic Journals: Is a Scalable Solution Possible?”の公開を発表しました。

JSTORは、2017年に全米人文科学基金(NEH)の助成を受けて、アラビア語の学術コンテンツをデジタル化するプロセスの研究を行いました。同研究はコスト効率がよく、大規模に実装可能で、高品質の画像、メタデータ、完全に検索可能なテキストを制作可能なアラビア語雑誌をスキャンするワークフローの開発を目標に、2年間のプロジェクトとして実施されています。

公開されたホワイトペーパーでは、JSTORの研究をアラビア語のデジタル化された学術雑誌文献全体の概況の中へ位置づけながら、プロジェクトの取り組みと得られた知見等が記述されています。ホワイトペーパーの結論の中では、アラビア語ジャーナルを高精度でデジタル化することが可能であること、OCRソフトウェア・OCRエンジンへの継続的な投資を行うことでコスト低減が可能であること、などが確証されています。

New: white paper on digitization of Arabic-language materials(JSTOR,2019/8/15)
https://about.jstor.org/news/new-white-paper-on-digitization-of-arabic-language-materials/

Digitizing Printed Arabic Journals: Is a Scalable Solution Possible? [PDF:105ページ](JSTOR)
https://about.jstor.org/wp-content/uploads/2019/08/NehAward_PW-253861-17_JstorArabicDigitizationInvestigation_WhitePaper_20190329.pdf

参考:
全米人文科学基金(NEH)、人文学に関する助成プログラム295件を公表
Posted 2015年12月15日
http://current.ndl.go.jp/node/30225

英国図書館(BL)、40点のアラビア語の科学に関する手稿を追加公開
Posted 2015年8月24日
http://current.ndl.go.jp/node/29236

Gale社、アラビア語資料の大規模なデジタル化プログラムの計画を発表
Posted 2015年3月25日
http://current.ndl.go.jp/node/28219