2024年12月12日、米・ハーバード大学ロースクール図書館に“Institutional Data Initiative”(IDI)が立ち上げられました。
IDIは、同大学ロースクールのLibrary Innovation Lab(LIL)により立ち上げられた研究プログラムです。図書館や政府機関を含む知識機関(knowledge institutions)と協力し、それら機関のコレクションをデータとして整備・公開していくとしています。AIを始めとするあらゆる用途のために、機関が保有するデータの利用可能性の向上に重点を置いているとあります。
IDIの当初の活動として、Google Booksプロジェクトの一環としてハーバード大学図書館でスキャンされた約100万冊のパブリックドメイン書籍をAI学習用データセットとして整備・公開すること、ボストン公共図書館と協力してパブリックドメインの新聞の数百万ページのデータを利用可能にすることなどが挙げられています。
Harvard’s Library Innovation Lab launches Institutional Data Initiative(Harvard Law Today, 2024/12/12)
https://hls.harvard.edu/today/harvards-library-innovation-lab-launches-initiative-to-use-public-domain-data-to-train-artificial-intelligence/
How Knowledge Institutions Can Build a Promethean Moment(IDI, 2024/12/12)
https://institutionaldatainitiative.org/hello-world.html
Institutional Data Initiative
https://institutionaldatainitiative.org/