カレントアウェアネス
No.357 2023年9月20日
CA2049
動向レビュー
自治体発行オンライン資料の収集:近年の公立図書館の取組を中心に
奈良大学文学部:竹田芳則(たけだよしのり)
1. はじめに
図書館法第3条第1号では、十分留意して収集すべき図書館資料の例示の筆頭として「郷土資料、地方行政資料」が掲げられている。この両者をあわせて「地域資料」という用語が使われるようになってきている。近年、歴史資料のイメージが強い「郷土資料」に代わって「地域資料」の用語が定着してきた背景には、地方行政資料の収集が重視されてきたことがあるだろう。
さらに、同法第9条の第2項では「国及び地方公共団体の機関は、公立図書館の求めに応じ、これに対して、それぞれの発行する刊行物その他の資料を無償で提供することができる」としている。公立図書館が、自治体の行政刊行物の独自の納本制度を策定したり、行政各部局への積極的寄贈を呼びかけるための、法的根拠とされている(1)。
こうした行政刊行物は、以前はその刊行情報や流通経路が広く公開されていないために、一般には入手困難な資料であり、図書館では「灰色文献」(CA1952参照)の代表的なものとされてきた。しかし、近年ではその多くが電子化され、自治体のウェブサイトで公開されて、誰でも、直接に最新の行政刊行物を閲覧してダウンロードできるようになっている。
一方、多くの行政刊行物が、紙の印刷は行わず、PDFだけの刊行となり、「ボーンデジタル化」が進行しつつある。しかもウェブサイトでの公開は最新版のみ、あるいは発行後一定期間にとどまる例もある。
さらに、先述の図書館法第3条第1号の「図書館資料」の範囲に、2008年の同法改正において「電磁的記録」が追加されたが、これは媒体に保存された物理的形態を有しているものに限られ、インターネットを通じて送信される情報、すなわちネットワーク情報資源は含まれないと解されている。したがって、こうしたオンライン上の刊行物も「図書館資料」の範囲外となるものである。
しかし、図書館が自治体が発行するオンライン上の刊行物も地域資料として収集の対象とすることは当然であり、各公立図書館においても、さまざまな取組がなされている。本稿では、近年のこうした取組および調査研究を概観するとともに、課題と展望を示してみることとしたい。
2. 地域資料サービスに関する調査研究
2016年に全国公共図書館協議会(全公図)は、地域資料サービスに関する調査を実施し、2018年に『公立図書館における地域資料サービスに関する報告書』としてまとめた(2)。
本調査は47都道府県、1,319市区町村を対象に実施され、回収率は、図書館設置自治体のうち、都道府県100%、市区町村98.8%にのぼっている。また、「電子行政資料」に対する取組が初めて調査されており、ここでは、この項目に限り、同報告書から調査結果の概要を紹介する(3)。
まず、本調査における「電子行政資料」とは、所属する自治体(市区町村。都道府県は除く)が公式ウェブサイト上で公開・提供する地域行政情報である。提供がCD-R、DVD-R等パッケージ系の電子メディアのみで行われ、ウェブサイトでは公開されていないものは除くとし、以下が例示されている。
- 従前は紙媒体で刊行されていた地域行政資料で、紙媒体による刊行を終了し、自治体ウェブサイト上の電子情報のみで提供されているもの。
- 紙媒体での刊行が継続されたまま、自治体ウェブサイト上でも同様の電子情報が提供されるようになったもの。
- 紙媒体での刊行を経ず、新たに自治体ウェブサイト上のみで提供が開始されるようになった行政情報。
こうした前提で、電子行政資料の収集を実施しているのは、都道府県立では27館(57.4%)、市区町村立では113館(9.0%)であり、とりわけ市区町村立では、実施率は低い結果となっている。収集を実施している図書館のうち、電子行政資料の図書館への納本の規程があるのは、都道府県立では3館、市区町村立では4館であるが、一方で「電子行政資料の収集に限定した方針や基準がある」図書館は、都道府県立で27館、市区町村立でも97館あり、制度化が進まないなかでも、図書館側で収集対象として位置づける努力がなされていることが見てとれる。
収集対象とする資料の範囲については、紙媒体での提供から電子情報での提供に変更された場合と、初めから電子情報で提供されている場合とに分けてファイル形式を尋ねている。いずれにおいても「PDFファイル形式で提供されているもの」が多いが、都道府県立においては、初めから電子情報で提供されている場合は、「収集対象としていない」館が7館あることが注目される。
収集に際して発行者の許諾を得ているかという質問に対しては、都道府県立では、「個別に得ている」との回答が14館と多かったのに対し、市区町村立では「包括的に得ている」館が48館で最も多い。
収集方法については、「図書館がウェブサイトから電子情報を収集」していると回答した館が都道府県立で20館、市区町村立で84館と最も多いが、「発行部署が紙媒体に印刷して図書館に送付」との回答もある。
保存方法としては、「電子情報を紙媒体に印刷」が、都道府県立で21館、市区町村立で88館を占め、電子情報のままハードディスクやメディアに保存しているケースは少数である。
また、提供方法についても「OPACに登録し、紙媒体で提供」が高い割合を示し、紙媒体での刊行が継続されている電子行政資料は、ほとんどの館で紙媒体での収集も継続している。
また、電子行政資料を「収集していない」と回答した図書館があげた理由として、都道府県立、市区町村立ともに、「対象資料の発行状況の十分な把握ができていない」とする回答が4割を超える。なお、電子行政資料を収集している図書館が、解決すべき課題として選択した中でも、これと同じ回答が圧倒的に多い。
3. 自治体発行オンライン資料収集の事例
公立図書館における、自治体発行オンライン資料の収集・保存・提供が比較的早くから行われている事例としては、岡山県立図書館の電子図書館「デジタル岡山大百科」(4)、大阪府立図書館の「おおさかeコレクション」(5)などが知られている。「カレントアウェアネス・ポータル」では、富山県立図書館(6)、福井県立図書館(E2158参照)、熊本市立図書館(7)、栃木県立図書館(8)、埼玉県立図書館(9)などにおいて、自治体発行オンライン資料の収集および提供サービスを開始したことが情報発信されている。
ここでは、先進事例として、「神奈川県行政資料アーカイブ」(E1736参照)(10)と静岡県立中央図書館のオンライン資料自動収集の事例(E2510参照)を、特に取り上げて紹介することとし、あわせて国立国会図書館(NDL)の取組にも触れたい。
3.1 神奈川県行政資料アーカイブ
神奈川県立図書館ウェブサイトによると、「神奈川県行政資料アーカイブ」は、「従来紙媒体で提供していた県の主要な行政刊行物のうち、県のウェブサイトで公表している、統計書、年報など(行政資料)の電子ファイル、統計データなどを提供するサイト」と説明されている(11)。
同館では、2015年4月のコンピューターシステム更新にあたり、同館の「神奈川資料」として重要な部分を占めると考えられる県の電子行政資料を電子ファイルのまま収集するために、機関リポジトリ機能導入の検討がはじめられた。その後、県政情報センターおよび県の行政資料を保存・提供する機能を持った公文書館を加えた3機関による連携事業とすることとなり、準備が進められた。
県立図書館において「神奈川県情報デジタルアーカイブ運用指針」を2015年4月に施行したことにあわせ、県政情報センターでは事務処理要領を改訂し、年報や統計書等の行政資料で紙媒体を廃止しウェブサイトで提供するとしたものについては、原則として図書館が運営するアーカイブに登録することとした。手順として、神奈川県庁の各部署は行政資料の電子ファイルを県政情報センターに送付すること、県政情報センターは送付された電子ファイルを図書館及び公文書館に送付することなどが定められた。電子ファイルの送付に際しては登録申請書の添付を求めており、その記載内容が電子ファイル登録時のメタデータとして使われている。
2015年8月の電子ファイルの登録開始にあわせ、図書館・県政情報センター・公文書館のそれぞれの役割を明確化した覚書が締結された。
電子行政資料の収集について、このように、庁内の関係機関と連携して、それぞれの役割も明確にしたシステムを構築している例は、理想的であるといえよう。組織的な資料収集体制のあり方として、今後の展開に期待がもたれる。
3.2 静岡県立中央図書館のオンライン資料自動収集
2022年5月、静岡県立中央図書館は,地域資料収集の一環として、静岡県内の自治体ウェブサイトにアップロードされた自治体発行オンライン資料のPDFを自動収集するシステムを県内IT事業者と共同開発したことを発表した。
同館では、県内発行の紙の自治体資料については、要綱および文書依頼により収集している。しかし、自治体資料の「ボーンデジタル化」が進み、しかも各自治体ウェブサイトから定期的に削除される例もあり、アクセスできなくなることが問題となっていた。
こうした課題を解決するべく、同館の「図書館DX実証実験」の一つとして、クローラによる自治体資料自動収集システムが開発された。クローリングの対象は県内の自治体ウェブサイトであり、ドメイン内に格納されているPDFファイルを収集する。
収集範囲はドメイン以下5階層目までであるが、5階層内のHTMLファイルにPDFファイルへのリンクがあれば、リンク先のPDFファイルが収集範囲の対象階層外にあっても収集する一方、外部ドメインへのリンクは収集しない。
収集したPDFファイルは、収集した日付ごとに、Googleドライブ上に収集元のドメインと同じディレクトリ構造で、保存・管理される。各ドメインのクローリングについて、初回は、その時点におけるクローリング範囲内にあるPDFを全て収集し、2回目以降は4半期に1回、前回との差分(変更・追加・更新)を収集する。
このシステムの画期性は、静岡県発行のオンライン資料だけでなく、県内市町村発行のオンライン資料すべてを収集対象としており、他県での取組に比べて、桁違いに収集量が多いことである。2022年4月末時点で初回のクローリングを終え、収集できたPDFは45万5,133件であった(12)(13)。
それだけに、収集したコンテンツに利用者が簡単にアクセスできるようにするためには、目録またはメタデータを作成するなど、多くの作業を要すると思われる。今後デジタルライブラリー「ふじのくにアーカイブ」で公開していく予定であるとしている。
3.3 WARPによる自治体発行オンライン資料の収集
NDLにおいては、国立国会図書館法に基づき、「国立国会図書館インターネット資料収集保存事業」(WARP)として、公的機関のウェブサイトの網羅的な収集を行っている(14)。このうち、地方公共団体、地方公社等の機関については、四半期ごとに、クローラと呼ばれる自動収集プログラムを用いてウェブサイト(サイト内に存在するオンライン資料を含む。)を収集している。また、自動収集できなかった情報については、個別に依頼を行い、発信機関からの送信・送付により収集しているケースもある。
これにより、自治体のウェブサイトに紐付いているPDFファイルなどの自治体発行オンライン資料も、NDLにより年4回網羅的に収集され、NDLで保存される。
収集されたウェブサイトは、収集した状態のまま保存されるほか、自治体発行オンライン資料の一部は、著作物単位で整理され、国立国会図書館デジタルコレクションで保存、提供されている。収集資料の閲覧サービスの提供は、NDL館内において行われるが、発信者から許諾を得たものはインターネット公開されている。
したがって、自治体発行オンライン資料について考える上で、少なくとも収集については、WARPにより網羅的に実施され、NDLにおいて情報資源の蓄積が行われていることを前提にすべきであろう。
4. 自治体広報誌のデジタル化・オープン化の課題
長塚隆は、神奈川県内の全市町村および東京都23区を対象に、各自治体発行の広報誌について、自治体ウェブサイト、公共図書館OPAC、WARPなどを併用してメタデータおよびデジタル資料を調査している。神奈川県内の調査では、市町村史や市町村勢要覧も調査対象としているが、ここでは広報誌に限って取り上げることとする。
まず、神奈川県内の広報誌のデジタル化・オープン化の状況は、ほとんどの市町村でPDF版あるいは電子ブック版などが、各自治体のウェブサイトで公開されている(15)。平塚市と小田原市では約70年前の創刊号から掲載がされているが、このような自治体はごく少数で、過去刊行分のデジタル化は20〜30%に留まっている。また横浜市と川崎市については、一定期間後に市のウェブサイトから削除され利用できなくなることも確認されている。
また同県内の過去の広報誌の公開状況であるが、多くの自治体では、WARPが収集したデータを「インターネット公開資料」に指定している一方、NDL館内限定公開としている市もある。
次に、東京都23区の広報誌のデジタル化・オープン化の状況についてである(16)。千代田区のみが創刊号(1953年)からデジタル化し、区のウェブサイトで公開しているが、他の区では最近の数年間に刊行された号に限定して公開しているところが多い。また、WARPで収集されたコンテンツとの比較により、過去にデジタル化して公開した広報誌を、区のウェブサイトから削除している区は、15区にも達するとしている。
また23区におけるデジタル広報誌の公開状況としては、5区において、WARPが収集したウェブサイトを、NDL館内限定公開としており、利便性を損なっているとしている(17)。
長塚は、こうした調査結果を踏まえ、2022年1月〜3月に対象自治体の担当窓口に対し、広報誌のデジタル化・オープン化の課題に関してアンケート調査を実施した(18)。
まず広報誌の創刊号からの公開については、東京都23区では、中野区が区立図書館デジタルアーカイブにおいて閲覧できるようにしていること、豊島区では「広報としまデジタルブック版」と「広報としまライブラリー」が運営されており、創刊号から公開しているが、区のウェブサイトではないためWARPの収集範囲外となっていることが判明したという。23区において、創刊号からデジタル化して公開している区は全体の13%で依然として低い。また、広報誌全号をデジタル公開する予定はないとする自治体も、23区で70%、神奈川県内市町村では61%にのぼるとしている。
次に、自治体ウェブサイトから過去の広報誌を削除している理由については、掲載できるデータ容量が制限されており、年数を決めて削除していると多くの自治体が答えている。また、担当者が、WARPにリンクをして過去の広報誌を紹介できることを認識していないケースも認められた。
WARPで収集されている広報誌の閲覧をNDL館内に限定している理由を聞いたところ、多くが利用制限をしている認識がないことが明らかになった。
以上、長塚の調査により、自治体広報誌のデジタル化・オープン化について、いくつかの課題が明らかになった。その中で、WARPにおけるNDL館内限定公開の問題や、WARPで収集済みのコンテンツとの連携や活用については、自治体の広報誌担当者の意識向上によって、比較的容易に解決できる問題ではないかと思われる。広報誌も含む自治体発行オンライン資料とWARPとの関係については、最後にあらためて論じることとしたい。
5. おわりに
以上、自治体発行オンライン資料の収集をめぐって、最近の公立図書館について、一部ではあるが特徴的な動向を紹介してきた。まとめにかえて、主にWARPとの関係を中心に課題を整理して、今後の展望についての私見を述べておきたい。
2014年7月、「神奈川県行政資料アーカイブ構築」のための検討会が、WARPをはじめとするNDLにおける神奈川県の行政刊行物の登録状況を調査した結果、殆どの資料は利活用に関して明示されておらず、閲覧はNDL館内限定であることがわかったと報告している(19)。
長塚による、東京都23区と神奈川県内市町村の広報誌のデジタル化・オープン化に関しての調査においても、多くの自治体広報誌が、WARPにおいてNDL館内限定閲覧となっていることがわかった。長塚の調査における主な調査対象は広報誌を主とするものであったが、自治体発行オンライン資料全般が同様の状況にあると想像される(20)。
こうした状況のなか、静岡県立中央図書館がクローラによる自治体資料自動収集システムを開発し、独自に県内市町村発行のオンライン資料の網羅的収集を開始した意義は大きい。今後、収集された自治体資料を利活用できるようなプラットフォームが用意されることを期待したい(21)。
いくつかの図書館で実施しているように、収集された自治体発行オンライン資料は、OPACで検索、閲覧できるようにするべきであろう。すでに紙の地域資料として受入されている行政資料が、紙での刊行を廃止し、オンラインでの発行に変わった場合でも、継続資料として扱うことができる。市区町村の図書館など、自館でオンライン資料の収集、保存が難しい場合であっても、OPACで書誌の検索はできるようにして、WARPの該当資料にリンクさせて、利用者の発見可能性を高めていくことが望ましい。
そのためにも、リンク先のWARPがNDL館内限定公開とされている場合は、図書館から庁内のサイト管理者に対し、取扱いを見直すよう申し入れるなどの取組も必要となるであろう。ただし、たとえNDL館内限定のままであっても、各図書館のOPACからリンクされるだけで、利用者の発見可能性は大きく向上することが見込まれる。
自治体ウェブサイトに紐付く自治体発行オンライン資料は、現在WARPによって網羅的に収集・保存されている。また、複数のドメインを運用している場合でも、すべてのドメインを収集対象としている。しかし、自治体のサイトとは別に運営されているサイトの中にはWARPの収集から漏れているものもかなりあると思われる。例えば、自治体の提供するオープンデータ(「機械判読に適したデータ形式で、二次利用が可能な利用ルールで公開されたデータ」という本来の意味のもの)の中には、「オープンデータカタログサイト」といった名称で、自治体ウェブサイトとは別サイトで提供されている場合がある(22)。また、公立図書館のホームページが、自治体のウェブサイトとは別サイトで運営されていたり、デジタルアーカイブなどが別サイトで運営されている場合もある。これらの中にはWARPの収集から漏れているものも見受けられる。
今後、こうしたWARPの収集から漏れている自治体の重要なデータを、その近くに存在する公立図書館が、地域資料として見逃さず収集し、将来の利用に向けて保存していくことが必要となっていくのではないだろうか(23)。
謝辞
本稿執筆にあたり、奈良大学OBの大藤真之氏に調査の補助をしていただいた。ここに記して、御礼申し上げる。
(1)図書館法第3条第1号で規定する「地方行政資料」と、第2号でいう地方公共団体の機関の発行する刊行物は厳密に言えば異なるが、ここでは単純化して、同一のものして述べる。また本稿では、こうした資料をオンラインにより提供されたものを、便宜上「自治体発行オンライン資料」と名付けておく。
(2)全国公共図書館協議会. 2016年度公立図書館における地域資料サービスに関する報告書.全国公共図書館協議会, 2017, 96p.
https://www.library.metro.tokyo.lg.jp/zenkoutou/report/2016/index.html, (参照 2023-07-14).
(3)前掲. p. 57-64.
(4)デジタル岡山大百科.
https://digioka.libnet.pref.okayama.jp/, (参照 2023-07-14).
(5)“おおさかeコレクション”. 大阪府立図書館.
https://www.library.pref.osaka.jp/site/oec/index.html, (参照 2023-07-14).
(6)富山県立図書館. はじめます「富山県立図書館行政資料デジタルデータ公開サービス」. 2017.
http://www.lib.pref.toyama.jp/attach/EDIT/000/000245.pdf, (参照 2023-07-14).
(7)“電子図書館が開館しました〔11月1日午前9時~〕”. 熊本市立図書館. 2019-11-01.
https://www.library.city.kumamoto.jp/index.php?key=jo2gy4if3-2331, (参照 2023-07-14).
(8)“【お知らせ】行政資料アーカイブについて”. 栃木県立図書館.
http://www.lib.pref.tochigi.lg.jp/index.php?action=pages_view_main&active_action=journal_view_main_detail&post_id=501&comment_flag=1&block_id=573#_57, (参照 2023-07-14).
(9)“埼玉県発行の「デジタル行政資料」の公開について”. 埼玉県立図書館.
https://www.lib.pref.saitama.jp/information/2022/07/28.html, (参照 2023-07-14).
(10)3.1の記述はE1736のほか、以下の論考にもとづく。
西野祐子. 電子化された行政刊行物と図書館 : 神奈川県行政資料アーカイブの構築の経緯、意義と課題から. 神奈川県立図書館紀要. 2016, 12, 24p.
https://www.klnet.pref.kanagawa.jp/uploads/2020/12/kiyou012_01.pdf, (参照 2023-07-14).
白石智彦. 神奈川県行政資料アーカイブによる行政資料へのアクセス. 情報の科学と技術. 2018, 68(10), p. 495-499.
https://doi.org/10.18919/jkg.68.10_495, (参照2023-07-14).
森谷芳浩. 関係機関との連携による神奈川県行政資料アーカイブの構築と運営について. 図書館界. 2020, 71(6), p. 320-325.
https://doi.org/10.20628/toshokankai.71.6_320, (参照 2023-07-14).
(11)“神奈川県行政資料アーカイブ”. 神奈川県立の図書館.
https://www.klnet.pref.kanagawa.jp/find-books/administrative-materials/, (参照 2023-07-14).
(12)2022年度末時点の自動収集実績は51万2,862件であり、着実に増加していることがわかる。
静岡県立中央図書館. 葵. 2023, 57, p. 15, 54.
https://www.tosyokan.pref.shizuoka.jp/assets/r5_aoi57.pdf, (参照 2023-07-14).
(13)杉本啓輔. 静岡県立中央図書館における自治体資料自動収集システムの開発と今後の可能性. 図書館雑誌. 2023, 117, p. 77-79.
(14)“インターネット資料の収集”. NDL.
https://www.ndl.go.jp/jp/collect/internet/index.html, (参照 2023-07-14).
なお、NDLでは、WARPとは別に「オンライン資料収集制度」(愛称:eデポ)が実施されているが、こちらは民間で出版された電子書籍、電子雑誌等を収集・保存することを目的としているため、本稿では言及しない。
(15)長塚隆. 地域資料のデジタル化・オープン化の促進への一提案-神奈川県の事例から-. 情報知識学会誌. 2021, 31(2), p. 224-229.
https://doi.org/10.2964/jsik_2021_030, (参照 2023-07-14).
(16)長塚隆. 地域資料としての自治体広報誌のデジタル化・オープン化の課題-東京都23区の事例から-. 情報知識学会誌. 2021, 31(4), p. 466-469.
https://doi.org/10.2964/jsik_2021_060, (参照 2023-07-14).
(17)ただし、5区のうち2区については、その後、NDL館内限定公開が解除されたと見られ、現在はWARPで一般公開されている。
(18)長塚隆. 地域資料としての自治体広報誌のデジタル化・オープン化に関するアンケート調査から. 情報知識学会誌. 2022, 32(2), p. 189-196.
https://doi.org/10.2964/jsik_2022_008, (参照 2023-07-14).
(19)西野. 前掲. p. 11.
(20)市区町村の広報誌は、原則として全世帯を対象に配布されるものなので、将来においても紙媒体での印刷が廃止され、ボーンデジタル化されることは考えにくい。紙の広報誌は、バックナンバーを地元の図書館で保存していることがほとんどなので、オンライン資料の収集対象の優先性はむしろ低いのではないか。優先すべきは、ボーンデジタルのオンライン資料の収集ではないだろうか。
(21)2022年11月14日、図書館総合展主催者フォーラムが、「公共図書館における行政資料電子化プロジェクト−新しい公共図書館の評価基準に向けて」をテーマに、オンライン開催された。ここでは、静岡県立中央図書館の自治体資料自動収集システムの事例をテーマに、電子書籍化によるディスカバラビリティ(発見可能性)とアクセシビリティ(特に音声読み上げによるバリアフリー化)の実現に向けた取組について、討議がされた。
“公共図書館における行政資料電子書籍化プロジェクト―新しい公共図書館の評価基準に向けて”. 図書館総合展.
https://www.libraryfair.jp/forum/2022/547, (参照 2023-07-14).
(22)例えば、大阪府堺市のオープンデータのカタログサイトは、外部の民間サイトhttps://odcs.bodik.jp/271403/ にあり、WARPでは現在のところ収集されていない。
(23)例えば、公立図書館において、その自治体の広報誌等から、オンライン資料の発行情報を毎号確認したり、年報などの逐次刊行物は、オンライン資料であっても、継続受入のチェックをするなどの作業をルーティン化することなども重要であろう。
[受理 : 2023-08-17]
竹田芳則. 動向レビュー:自治体発行オンライン資料の収集:近年の公立図書館の取組を中心に. カレントアウェアネス. 2023, (357), CA2049, p. 19-23.
https://current.ndl.go.jp/ca2049
DOI:
https://doi.org/10.11501/12996502
Takeda Yoshinori
Attempts for Collections of Prefectural and Municipal “Online Materials”: With a Focus on Public Libraries in Japan