米国国立公文書館(NARA)、1950年の国勢調査をデジタル化しウェブサイトで公開予定

2021年12月14日、米国国立公文書館(NARA)が、1950年国勢調査のデジタル化プロジェクトについてのお知らせを掲載しました。

発表によると、1950年国勢調査の専用のウェブサイトを構築し、人工知能/機械学習や光学文字認識(OCR)を活用した名称検索機能を提供するとあります。ウェブサイトの公開は2022年4月1日を予定しています。その他、利用者が名称の修正を提案できるテキスト化ツールを開発したこと、正確な記録を作成できるよう一般の人からの協力を奨励すること等が述べられています。

また、「アマゾン・ウェブ・サービス(AWS)」が提供する“Registry of Open Data”でメタデータ等のデータセットを公開予定であり、データのサイズは165テラバイト以上となるとしています。

1950 Census Release Will Offer Enhanced Digital Access, Public Collaboration Opportunity(NARA, 2021/12/14)
https://www.archives.gov/news/articles/1950-census-access

参考:
米国国立公文書館(NARA)、同館の目録および1940年国勢調査のデータセットを公開
Posted 2021年4月22日
https://current.ndl.go.jp/node/43869

米国国立公文書館(NARA)、1940年の国勢調査を公開
Posted 2012年4月5日
https://current.ndl.go.jp/node/20556