静岡県立中央図書館、静岡県内の自治体ウェブサイトに掲載されたPDFを自動収集するシステムを地元企業と共同開発

2022年5月18日、静岡県立中央図書館が、静岡県内の自治体ウェブサイトに掲載されたPDFを自動収集するクローリングシステムを、地元企業の株式会社Geolocation Technologyと共同開発したと発表しました。

発表の中では、2021年度から同館が行っている「図書館DX実証実験」の一環であり、公共図書館におけるクローリングシステムの開発は全国初であると述べています。初回の収集で収集されたPDFは45万5,133件で、2回目以降は差分の収集が行われます。また、収集したPDFを基にしたサービスの可能性を今後検証するとしています。

@shizuokaken_lib(Twitter, 2022/5/18)
https://twitter.com/shizuokaken_lib/status/1526791553544425472

【全国初】静岡県内の自治体WebサイトにアップロードされたPDFを自動収集するクローリングシステムを地元企業と共同開発(PR Times, 2022/5/18)
https://prtimes.jp/main/html/rd/p/000000137.000079445.html

参考:
静岡県立中央図書館、図書館DX実証実験を実施:第1弾は貸出カードのスマートフォン表示
Posted 2021年9月1日
https://current.ndl.go.jp/node/44715

静岡県立中央図書館、図書館DX実証実験第2弾「利用者登録等Web申込」と第3弾「電子図書館」を10月1日から実施
Posted 2021年9月27日
https://current.ndl.go.jp/node/44874