カレントアウェアネス
No.275 2003.03.20
CA1490
動向レビュー
欧州のウェブ・アーカイビング
1.欧州におけるウェブ・アーカイビングの背景と全域プロジェクト
欧州委員会(European Commission: EC)は欧州域内の情報格差および欧州と米国との情報格差の拡大への懸念から,総合的な情報基盤整備を目指し,2000年6月に電子欧州行動計画(eEurope2002)を開始した(1)。欧州のデジタルコンテンツ整備は計画の主要課題のひとつであり,電子出版物の保存もこの領域に位置付けられ,推進されてきた。背景には特に,米国との格差縮小を情報面を含むあらゆる面において最重要課題とする欧州の姿勢を見て取ることができる。また電子出版物の保存の意義は,学術研究の環境整備と文化政策の両面に見出すことができるが,欧州において,特に英語を母国語としない国々においては,国内の出版物を保存することはすなわち,母国語の出版物という独自の文化資産をいかにして次世代に遺していくか,という課題に結びつくという面で重視される。
自国出版物の保存は,多くの国では納本制度によって担保されてきた。納本法によるもの,著作権法によるもの,国立図書館法によるもの,など依拠する法に違いはあるが,それらの法を通じて,すでにいくつかの国が電子出版物を納入対象に含めている。オフラインの資料に限定するものが多数ではあるが,デンマーク,フィンランドなどオンライン出版物を対象としている国もすでに見られる。オンライン出版物については,著作権やプライバシーなどに関わる法的問題や保存範囲の問題など,解決しなければならない課題も山積している。一方で,その対応策を模索している間にも日々多くの情報が失われており,特に動きの激しいウェブ上の情報資源の保存問題は各国において極めて緊急度の高い課題となっている。
こうした危機感のもとにユネスコもまた,『法定納本制度のためのガイドライン』(2)において,あらゆる種類の電子出版物が各国の責任において法定納本されることが原則であり,技術的法的課題が解決されていないことを理由に,世界の出版文化遺産の重要な一部が保存されないということは,到底正当化できない,との厳しい見解を示し,早急の対応を呼びかけている。また,こうした取り組みに対して国の政策レベルで高い優先順位が与えられるよう,「デジタル文化遺産保存憲章」(E021参照)の準備も進められている。
欧州では北欧諸国をはじめとして多くの国が,早くからこの課題に取り組んできた。しかしながら,歴史も母国語も異なる国々の取組みは決して一様ではない。
欧州の電子出版物保存プロジェクトのうち,英国が中心となっているものに,英国図書館によるDomain.uk,電子情報保存連合(Digital Preservation Coalition:DPC)の活動,主として高等教育機関が展開するCEDARS(CURL Exemplars in Digital Archives)などがある(CA1467,1489参照)。欧州大陸部では,国全体のウェブ情報を保存する試みが,Kulturarw3プロジェクトをいち早く立ち上げたスウェーデンをはじめ,フィンランド,デンマークなど北欧諸国に見られる(3)。
一方,欧州全域に及ぶものに欧州納本図書館の実現を目指すNEDLIB(Networked European Deposit Library)プロジェクトがある(CA1401参照)。これは欧州委員会の資金援助によって1998年から2000年にかけて実施されたもので,最終的にEU12か国の国立図書館の参加を得た。出版社と共同で先進的な試みを行ってきたオランダが主導的役割を果たした。国によって方針や見解,アーカイビングへのアプローチも異なりはするが,それらを共通の議論の俎上に載せることによって,情報を共有し,共通の基盤を築くことに貢献した(4)。
NEDLIBでの成果をふまえて,2001年11月,欧州委員会は2002年からの新たな3か年のプロジェクトERPANET(Electronic Resource Preservation and Access Network)を立ち上げた(5)。NEDLIBが比較的技術的な共通基盤のモデル構築に力を注いでいたのに対し,ERPANETではより総合的な政策面に重点が置かれている。電子出版物の保存に関する欧州域内での取組みの不要な重複を排し,情報交換のためのクリアリングハウスおよび研究開発,政策プラニングのための組織を目指す。
ERPANETは特に,電子資料の保存を支える関係者〜技術提供者,作成者(著者等),保存者,監視者,利用者,支援者(政策決定者等)〜の相互の連鎖に注目し,総合的な政策の必要性を訴えている(図)。すなわち,保存の問題は情報流通の最終段階のみでなく,その連鎖全体に関わる問題である,という認識を共通のものにすることを目的と考えるのである。
この目的を達成するため,ERPANETは以下の6つのサービスを展開している。
- ワークショップの開催(erpaworkshops)
- 研修活動(erpatraining)
- 実地研究活動(erpastudies)
- 調査/評価活動(erpaassessment)
- 助言活動(erpaadvisory)
- 様々な枠組みの提供(erpatools)
欧州のウェブ・アーカイビングは,重層化,多様化を極めており,今後これらの取組みが相互にどのようにリンクし,協力関係を築いていくのか,注目される。
次項以下では,欧州域内のオランダ,ドイツ,フランス,スウェーデンの4か国のトピックが取上げられている。これらの非英語圏の取組みは,わが国にとっても貴重な示唆を与えてくれるであろう。
(1) eEurope2002. (online), available from < http://europa.eu.int/information_society/eeurope/index_en.htm >, (accessed 2003-02-06).
(2) Lariviere, Jules. “Guidelines for legal deposit legislation”. UNESCO, 2000, 61p. (online), available from < http://www.unesco.org/webworld/publications/legaldeposit.rtf >, (accessed 2003-02-06).
このガイドラインは欧州の法定納本制度を対象に作成された次のガイドラインを下敷きにしている。
Council of Europe. Council for Culutural Co-operation. Culture Committee. Guidelines on Library Legislation and Policy in Europe. 1999, 26p. (online),available from < http://www.coe.int/T/E/Cultural_Co-operation/Culture/Resources/Reference_texts/Guidelines/ecubook_R3.asp >, (accessed 2003-02-06).
(3) 廣瀬信己. 北欧諸国におけるウェブ・アーカイビングの現状と納本制度. 国立国会図書館月報. (490), 2002, 14-22.
(4) Van der Werf-Davelaar, Titia. Long-term Preservation of Electronic Publications. D-Lib Magazine. 5(9), 1999, (online) available from < http://www.dlib.org/dlib/september99/vanderwerf/09vanderwerf.html >, (accessed 2003-02-06).
(5) ERPANET – Electronic Resource Preservation and Access Network. (online), available from< http://www.erpanet.org >, (accessed 2003-02-06).
ERPANET. Principles of digital preservation Draft v.4.1. ERPANET, 2002, 7p. (online), available from < http://www.erpanet.org/www/content/documents/Digitalpreservationcharterv4_1.pdf >, (accessed 2003-02-06).
2.オランダ国立図書館のアーカイビング事業
オランダ国立図書館(Koninklijke Bibliotheek: KB)では目下のところ,「ウェブ・アーカイビング」と名づけた事業は行っていない。しかしこれは,電子情報やウェブ情報を軽視しているためではない。むしろKBでは,電子情報の時代を意識した取り組みを積極的に推進している。その姿勢は,貴重書の電子化,JSTORの活用といった事業面に現れている。特筆すべきは,電子情報の長期的な保存と提供を図書館が担うべき役割として位置付け,それを意識した調査研究を進めてきたことである。以下ではこのことを,ウェブ・アーカイビングに関係する三つの点を通して確認する。システムの開発,出版業界との連携,そしてオンラインジャーナルのアーカイビングである。
第一にKBは,電子情報を扱えるシステムの開発に取り組んできた。ウェブ・アーカイビングに関しては,NEDLIBプロジェクトがまず目を引く。NEDLIBはヨーロッパの納本図書館による共同研究で,KBが事業の中心となった。この事業ではNEDLIB ハーベスタという,ウェブ情報の収集に特化したソフトを開発している。しかしそれ以上に重要なのは,IBM社との協力関係である。KBでは,電子情報を処理するシステムの開発をIBM社に依頼すると同時に,電子情報の長期的保存について,同社と共同研究を進めてきた。マイグレーション等の技術的課題はもちろん,ウェブ・アーカイビングもまた,ここでの研究課題の一つとなっている。アーカイビングを進める上で踏まえなければならない問題点が,ここで検討されたのである。IBM社からは2002年秋に,電子情報の収集,検索,管理のためのシステム「e-depot」が納められた。後述するオンラインジャーナルの処理に用いられるのは,このシステムである。
第二には,出版業界との連携である。KBでは1996年に,文化遺産の保存の責務を果たす観点から,パッケージ系の電子出版物の収集を始めた。しかし電子出版物を確実に納本制度の枠に含めるため,さらに踏み込んだ措置をとった。1999年に,オランダ出版協会との間で,電子出版物の納入について協定を結んだのである。この協定は,オンラインの出版物を納本制度に含める根拠になるものである。
しかし第三に,最も注目すべき事業として挙げられるのは,オンラインジャーナルのアーカイビングである。オランダには,エルゼビア・サイエンス社の本社がある。いうまでもなく同社は,オンラインジャーナル発行の最大手である。そしてKBが同社と提携し,同社発行のオンラインジャーナルを保管する公的な電子アーカイブの役割を果たすことが,2002年の国際図書館連盟(IFLA)グラスゴー大会で公表されたのである。
この提携関係は三つの点で,通常の利用契約とは異なる。第一に図書館側は,蓄積と保存のための研究開発を行う。特に重要なのは,記録内容と読み取りソフトとの両面にわたり,マイグレーションの責任を持つことである。第二に図書館側は,収められた情報を自館資料として提供する権利を持つ。このため,エルゼビア側が天災や倒産等で提供を停止しても,図書館での提供は継続される。第三に,納入対象が現在提供中のものに限られない。新規創刊誌も納入対象となり,目下電子化作業中である紙媒体時代のバックナンバーもまた,電子ファイルの形で納入される。
上記の特徴は,オンラインジャーナルの長期提供のための難点を意識し,その解決を目指したものである。つまり版元と図書館とが協力して,オンラインジャーナルが紙媒体より劣る点の解消を試みたのである。したがって,オンラインジャーナルが紙媒体に取って代わるかどうか,またその際に図書館が果たしうる機能は何かを見極める上で,この試みは重要である。
この事業はウェブ・アーカイビングと銘打ってはいない。しかしKBは,エルゼビア社という絶好の提携相手が国内に存在する利点を活かしつつ,ウェブ・アーカイビング実現に向かう第一歩を,オンラインジャーナルという比較的処理が容易な領域から踏み出したものと考えられる。KBは,ウェブ情報への着実な対処の途上にある。今後の動きが無視できない。
Ref.
Elsevier Science and Koninklijke Bibliotheek. “National Library of the Netherlands and Elsevier Science make digital preservation history”. (online), available from < http://www.elsevier.com/homepage/newhpgnews/preview/KB/links/link5.htm > and < http://www.kb.nl/kb/pr/pers/pers2002/elsevier-en.html >, (accessed 2003-02-04).
Dutch Publishers’ Association et al. “Arrangement for depositing electronic publications at the Deposit of Netherlands Publications in the Koninklijke Bibliotheek”. (online), available from < http://www.kb.nl/kb/dnp/overeenkomst-nuv-kb-en.pdf >, (accessed 2003-02-04).
KB. Articles. (online), available from < http://www.kb.nl/kb/menu/cat-art-en.html >, (accessed 2003-02-04).
KB. Deposit of dutch electronic publications. (online), available from < http://www.kb.nl/kb/dnp/dnep-en.html >, (accessed 2003-02-04).
KB. Digital archiving and preservation. (online), available from < http://www.kb.nl/kb/menu/ken-arch-en.html >,(accessed 2003-02-04).
KB. e-depot: KB accepted new system october 1. (online), available from < http://www.kb.nl/kb/ict/dea/planning-en.html >, (accessed 2003-02-04).
KB. Electronic journals – full-text articles. (online), available from < http://www.kb.nl/kb/zoek/db/etij-en.html >, (accessed 2003-02-04).
KB. Project history. (online), available from < http://www.kb.nl/kb/ict/dea/ltp/jointstudy/page1.html >, (accessed 2003-02-04).
鈴木敬二. 在外研究報告:オランダにおける大学図書館活動. (オンライン), 入手先 < http://www.ulis.ac.jp/library/Choken/1999/choken7_15.html >, (参照 2003-02-04).
Verhoeven, Ir. Hans. Archiving Web Publications. (online), available from < http://www.kb.nl/kb/ict/dea/ltp/reports/6-webpublications.pdf >, (accessed 2003-02-04).
3.ドイツ・ネットワーク情報イニシアチブ(DINI)
欧州の動向については本誌(CA1467参照)で報告されたようにいくつかのプロジェクトがある。ドイツに関しては,本誌でも電子図書館関連の報告がなされており(CA1257,1263,1270参照),欧米諸国に遅れをとっているわけではない。本稿ではドイツ図書館(CA1144参照)を含めたプロジェクトとドイツ全体の政策として構想された「ドイツ・ネットワーク情報イニシアチブ( Deutsche Initiative fuer Netzwerkinformation: DINI)」の動向を報告する。
電子出版物の収集活動に関しては,すでに報告されている(CA1204参照)。DINIの動向を要約すると,ネットワーク情報資源の収集・保存・管理・利用という側面からのみを検討するのではなく,戦略的な視点で構成されている。つまり連邦教育学術省(BMBF)が進める電子図書館プロジェクトDigital Library Forum (DLF)の一環に組み込まれている。ウェブ・アーカイブの収集対象としてネットワーク情報源すべてを対象にするのではなく,大学が刊行する「灰色文献(graue Literatur)」(商業ベースに乗りにくい出版物である博士学位論文,教授資格論文(Habilitationsschrift)等が最初に指定された対象である。)を優先している。米国でのオープン・アーカイブ・イニシアチブ(OAI)を範とし,ドイツ版OAIと位置付け,世界的な学術情報流通ネットワークでの利用に資することを目的としている。戦略的な施策の背景には,2002年に公表された「生徒の学習到達度調査(OECD/PISA: OECD Programme for International Student Assessment)」での順位が加盟国中平均20位前後という衝撃的な結果がある。教育改革の一環としてEラーニング政策を掲げ,ネットワーク情報の普及と推進に連邦を挙げて取り組む姿勢を顕著にしている。DINIの特徴に教育の基盤として組み込まれている点を挙げることができるかもしれない。DINI発足の端緒は,1991年秋の第1回学術計算機センター所長会議とドイツ図書館協会の第4部会が共催した「新しいコミュニケーションと情報サービス:学術計算機センターと大学図書館の連携の可能性と形態」会議に遡る。関連機関や諸学会が数年おきにネットワーク情報に連関するシンポジウムやワークショップを開催しながら,現在の組織を発足させたのは2000年初頭である。以後,年次総会を開きながら戦略的な議論を煮詰めている。以下,年次総会のテーマを示す。
- 第1回(2000年9月 ドルトムント)
「ネットワーク情報のコーディネーション,共同作業と相乗効果」
(OAIを支援するDINIアピールを刊行) - 第2回(2001年12月 ボン)
「危機あるいは好機?情報基盤の変革」 - 第3回(2002年9月 ドレスデン)
「Eラーニング普及のための基盤必要条件」
DINIは,会議を重ねながら参加機関と協定を取り結ぶことで事業を具体化している。主要な活動をあげておく。
さらにネットワーク情報の生産者組織「IuKイニシアチブ:ドイツにおける学術情報とコミュニケーション(IuK Initiative: Information und Kommunikation der wissenschaftlichen Fachgesellschaften in Deutschland.)」との共同作業推進を協定した。重点領域は次の4点である。1)メディア制作,2)教育におけるビデオ技術とその応用シナリオ,3)公開設置コンピュータ,4)電子出版。(協定草案2001年3月14日 トリール大学)
「DINI展望のためのブレインストーミング」の会議(2002年1月 ゲッティンゲン大学図書館)では,「重点作業領域2002」として,9つのグループに分かれて問題を検討することが取り決められた。
重点領域のひとつ「電子出版」に関して,第1回年次総会の成果物として『大学での電子出版:勧奨事項 (Elektronische Publizieren an Hochschulen: Empfehlungen)』が刊行された。その中では,電子出版の特徴を活かして,可能な限り著者が作成するデータを自動的に図書館システムの目録作業に活用する視点を用いて以下のようにまとめられている。
- (1) 商業ベースで出版されない灰色文献をネットワーク情報として体系的検索・利用を可能にする。
- (2) 大学は学術情報生産者として,査読システムの担い手でもあると同時に消費者でもある。大学はこの学術情報流通全体に責任があり,世界規模での競合関係にある。
- (3) デジタル形式による学術文献の利用と提供は,新しい「電子出版文化」とも言える。著者の役割は極めて重大である。テキストの構造化は定性的な検索精度の改善に重要な役割を担うからだ。
- (4) 上述の機能を確実に遂行するためには,標準規格と原則の徹底に重要な意義がある。特にダブリン・コア,OAI等世界標準の規格がそれである(注)。
- (5) 大学では,法的,財務的,人事的,資源的な諸前提が出版過程において問題となる。
- (6) 文献サーバと出版サーバが,技術の中核である。これは大学の(7)の出版指針の問題でもある。
- (7) ドイツの大学では,様々な変則的な問題(大学ごとの慣例等)があろうが,技術的にはOAIの仕様に則った基本指針を作成することが望ましい。
勧奨案では,著者の視点,利用者の視点,図書館,計算機センター,大学経営,出版の6項目に配慮することが確認されている。
現在のDINIの参加機関数は下記のとおりである。バイエルン州立図書館など主要な大図書館が参加していない。
機関種別 参加登録数 図書館 23 メディア・センター 14 計算機センター 15 専門学会 4 参加機関数が増えれば,ネットワーク情報資源が産み出す知的生産は著しく伸びるであろう。東西ドイツの統合が財政を逼迫させ,ドイツ図書館研究所の閉鎖などの問題を誘発しているが,統合の弊害を解決しながら学術情報政策は成果をあげている。DINIはいずれ国際的に大きく開花し,利用されるであろう。
脱稿を前にして,メーリング・リスト上でミュンヘン大学に提出した博士論文がフランスのサイトで閲覧可能と著者自ら知らせてきた。論題は「電子出版影響下でのSTM雑誌の変革」とある。ネットワーク情報資源のダイナミックな運用に直面した一瞬であった。ネットワーク情報資源は共有が容易である。共有の相乗効果が知の創造を活性化するとスタンフォード大学のレッシグは運動を推進しているが,欧州の動向はこの運動をまさに実践しているともいえよう。知をネット環境で共有する意義が,知の公共性を改めて問い質しているように思われる。中部大学附属三浦記念図書館:松林 正己(まつばやし まさき)
(注) なおテクニカル面では,主題分類にはデューイ十進分類(DDC)を導入する。メタデータの変換と交換を容易にするためにOAIに準じた規準を導入する。それは「OAIインターフェイスの内容構成:ドイツの大学のためのデータ供給勧奨案(Inhaltliche Gestaltung der OAI-Schnittstelle: eine Empfehlung fuer Daten-Provider an deutschen Universitaeten)」で指示されている。またネットワーク面ではグリッド・コンピュータの導入が計画されている。Ref.
Deutsche Initiative fuer Netzwerkinformation(DINI). (online), available from < http://www.dini.de/index.php >, (accessed 2003-01-24).
digital library forum. (online), available from < http://www.dl-forum.de/ >, (accessed 2003-01-24).
IuK Initiative. (online), available from < http://www.iuk-initiative.org/ >, (accessed 2003-01-24).
Dissonline.de: Digitale Dissertationen im Internet. (online), available from < http://www.dissonline.de/ >, (accessed 2003-01-24).
村山正司. 「著作権拡大は創造性殺す」:『コモンズ』の著者レッシグ氏に聞く. 朝日新聞. 2003-01-09. (夕刊)
Stanford Law School Lawrence Lessig. (online), available from < http://cyberlaw.stanford.edu/lessig/ >, (accessed 2003-01-24).
4.BnFの実験―大規模ウェブ・アーカイビングの実現に向けて―
インターネット資源は代々受けつがれていくべき遺産であり,その保存は緊急に実行されなければならない。フランス国立図書館(Bibliotheque nationale de France: BnF)はこれまでも「記憶の機関」として,納本制度により,1537年図書,1921年定期刊行物,1992年音楽,ビデオ,マルチメディア,ソフトウェアとその収集対象を拡げてきたが,ウェブ・アーカイビングという新しい使命をどのように果たしていくべきか探るために,1998年からいくつかの予備研究をスタートさせた。
技術面ではNEDLIBに参加することで,BnFは他の国立図書館と親密な交流を行い,特に収集ロボットの実験に協力した。
1999年にはドキュメントコンテンツの研究が行われた。この研究はBnFが提供しているサイト集”Signets de la BnF”の中から,大学,研究所などが提供する23のサイトをサンプルとして選び,146,000のファイルについて,そのタイプ,容量,リンク数,メタデータの分析を行ったものである。その結果,(1)サイト全体の一括収集の必要性,(2)豊富なコンテンツ,(3)メタデータ項目の小なさ,(4)リンクの多さという,ウェブの納本制度のための重要な諸点が明白になった。
2000年には,国立高等情報科学図書館学校(Ecole nationale superieure des sciences de l’information et des bibliotheques : ENSSIB)と共同でフランスの電子雑誌の予備調査が行われた。結果,その多くが不安定,不定期で出版の様式が絶えず進化する電子雑誌の調査は,その時点では困難であることが明らかになった。6月には,スウェーデン国立図書館が1997年から行っているバルク収集についての研究も行われた。これらの研究を受けて,7月,法定納本制度学術委員会は,インターネットサイトが有益な共有財としての性格をもち,オンラインドキュメントにも納本制度を拡大する必要性があると判断を下し,文化通信省に勧告がなされた。
BnFは現在,将来の新法の枠内で大規模にウェブ・アーカイビングが行われるように,ウェブの収集選択,変換,保存に関わる運営,処理についてさらに研究を積み重ねている段階である。
BnFのウェブ・アーカイビングの特徴は,できるだけ自動収集を行い,必要なときだけ人間が介入する方法にある。BnFは2001年から協力関係にあった国立情報処理・自動化研究所(Institut national de recherche en informatique et en automatique : INRIA : 研究省および経済・財政・産業省の監督下にある科学技術機関)と協力して,包括的なウェブ・アーカイビングのための初めての実験を行った。自動収集プロジェクト「Xyleme」においてINRIAが開発したロボット技術を基礎とし,収集範囲はフランスのドメイン.frにしぼられた。スナップショットによる収集の後,職員によってデータの分析が行われた。
ロボット収集と人手による選択の比較をするために,2002年冬,BnFはサイトの重要度を推測する調査を実施している。8人の専門知識をもつ職員が参加して,ランクづけされたサイトを標本評価した。調査標本は2001年秋にXylemeによって収集された8億ページから抽出され,国のドメイン.frに限られた。標本サイトの重要度は,当該サイトにリンクしている外部ページの数に基づいたXylemeのランキングアルゴリズムを用いて10から100までの数値で表され,その数値をもとに9つのレベルに区切り,各レベルごとに100のサイトを選択した。応答がないサイトとe-コマースサイトについては,手動で664サイトが除かれた。残った236サイトについて,職員が,(1)収集されるべきではない,(2)収集されてもよい,(3)コレクションの中にある方がよい,(4)確実にコレクションの中にあるべきだ,という4レベルで評価を行った。理想の評価と考えられる職員評価の中間値が,Xylemeのランキングアルゴリズムに基づいた選択と比較された。その結果は,Xylemeのランキングアルゴリズムに基づく選択が,人の評価にかなり近かった。積極的には収集しない(1)と(2)のレベルにおいて両者の合致率は60パーセント,積極的に選択するレベル(3),(4)においては75パーセントであった。この結果をBnFは肯定的に評価しており,主題を限定すれば合致率はさらに向上すると見ている。
BnFはまた,データベースなどの深層ウェブについても実験を行った。視聴覚資料部によって選択された16サイトについてウェブ管理者より情報を得,小さなロボットによってそのコンテンツを収集する試みを行った。その結果,ほとんどのサイトがダウンロードできず,中には,巨大容量のもの,静的サイトが動的に変化するもの,キャッシュストリーミング技術を使用しているものなどが含まれ,自動アーカイビングが困難であることが判明した。
ウェブページやサイトを分析して評価することは,大規模なウェブコレクションを築くための優先課題である。現在は人によっても,またロボットによっても満足する選択はないであろう。さらなる技術と実験が必要である。
日仏会館図書室:清水 裕子(しみず ゆうこ)Ref.
Abiteboul, S. et al. “A First Experience in Archiving the French Web.” (online), available from < http://www-rocq.inria.fr/~cobena/Publications/archivingECDL2002.pdf >, (accessed 2003-1-10).
BnF. “Depot legal et numerotations.” Informations pour les professionnels. (online), available from < http://www.bnf.fr/pages/zNavigat/frame/infopro.htm >, (accessed 2003-1-10).
Masanes, J. “Archiving the Web : experiments at the BnF.” DNER. (online), available from < http://www.dpconline.org/graphics/events/presentations/pdf/Masanes.pdf >, (accessed 2003-1-11).
Masanes, J. Towards Continuous Web Archiving: First Results and an Agenda for the Future. D-Lib Magazine. 8(12), 2002. (online), available from < http://www.dlib.org/dlib/december02/masanes/12masanes.html >, (accessed 2003-1-10).
5.スウェーデン国立図書館のウェブ・アーカイビングに関する政令
スウェーデン国立図書館(Kungliga Biblioteket)は1996年から「Kulturarw3 projekt(ウェブ文化遺産計画)」(CA1214参照)と称して,ウェブ上の情報資源を収集し,保存し,利用可能にするウェブ・アーカイビング計画を実行中であるが,2002年5月に関係する政令が出たので,ここに紹介する。
政令のタイトルは「国立図書館のデジタル文化遺産計画(訳注:ウェブ文化遺産計画)における個人情報の処理に関する政令(2002年法令第287号)」である。
政令制定の背景には国立図書館がウェブ・アーカイビングを行うことに関する法的根拠の曖昧さがある。ウェブ・アーカイビングはロボットと呼ばれるプログラムを用いてウェブ上の情報を自動的に収集するため,個人情報の保護の問題が生じてくる。関係する法律として1998年の個人情報保護法(Personuppgiftslagen(1998: 204))があるが,国立図書館がウェブ・アーカイビングを行うことについて直接の規定はない。国立図書館は1996年の計画開始当初から,収集を妨げる規定は法律上存在しないという解釈をとってきたが,一方で収集した情報資源に対するアクセスの許可申請は当面すべて拒否してきた。2001年の夏,計画の合法性に疑問をもつ者が現れ,個人情報保護法の監督官庁であるデータ検査院が疑義の一部を認めたことから,問題は表面化した。国立図書館はこれに対し裁判所に異議の申立てを行い,一方で政府も政令の制定を急いだ。制定に中心となって取り組んだのは教育省である。政令は2002年5月8日に制定された。政令は国立図書館に対し,ウェブ上の情報資源を収集する権限のみならず,図書館の敷地内でこれを利用させる権限をも与えている。
政令の具体的な内容は次のとおりである。政令は全13条からなる。
第1条は政令の適用範囲である。「この政令は,デジタル文化遺産計画に係る国立図書館の業務における個人情報の自動処理に対し,完全に,又は部分的にこれを適用するものとする」(条文を全訳,以下同じ)。
第2条は定義規定である。「(第1項)この政令においてデジタル文化遺産計画(訳注:以下,計画という)とは,インターネット上にスウェーデンの資料の形態で発表される国のデジタル文化遺産を自動ロボット技術を用いて収集し,保存し,かつ利用可能にする国立図書館の計画をいう」。「(第2項)この政令においてインターネット上で発表されるスウェーデンの資料とは,アドレス,名宛人,言語,著者又は発信者を媒介として,スウェーデンに属するとされる資料をいう」。
第3条は個人情報保護法との関係を規定する。「(第1項)個人情報保護法(1998年法令第204号)は,この政令又は同法第2条にいう別段の定めがある場合を除き,計画における個人情報の処理にこれを適用する」。「(第2項)記録された個人は,この政令により認められる処理に反対する権利を有しない」。
なお個人情報保護法については専修大学名誉教授の菱木昭八朗氏による全訳,解説があるが,その概要を述べると次のようになる。同法は「個人情報」を「処理される情報の対象となっている生存者に関する直接的又は間接的なすべての個人情報」と定義する(第3条)。また「個人情報の処理」を「個人情報の収集,記録,編集,蓄積,改訂,変更,授受,利用,第三者を通じての情報の提供,拡散,その他情報の供給,編成,合成,封鎖,消去又は破壊等に関する個別的もしくは一連の作業」と定義し(第3条),個人情報の全部又はその一部が電算機によって処理される場合には同法を適用するとしている(第5条)。そして個人情報を処理する「個人情報管理者」は,処理される個人情報の対象者である「被記録者」の同意がある場合か,又は法的義務を履行するために必要な場合など特段の事由がある場合に限り,個人情報を処理することができる(第10条)。個人情報管理者は処理に先立ち監督官庁に届け出を行うか,又は個人情報が適法,適正に処理されているか否かを独立して監視する自然人である「個人情報代理人」を選任する(第36-37条)。個人情報代理人は処理の方法に瑕疵を発見した場合,そのことを個人情報管理者に指摘しなければならず,個人情報管理者が早急に改善措置を講じなかった場合,その事実を監督官庁に報告しなければならない(第38条)。監督官庁は処理が行われている場所への立ち入り検査を行い,改善を指示し,又は制裁金を付して処理の中止を命ずる等の権限を有する(第43-47条)。監督官庁はデータ検査院である(個人情報保護規則(Personuppgiftsfrorning(1998: 1191))第2条)。
話を戻して政令第4条は個人情報の責任についての規定である。「国立図書館は,計画における自己の個人情報の処理に対して,個人情報に関する責任を負う」。なお個人情報管理者は個人情報保護法により,様々な注意義務や安全対策を講じる義務を負っている(第9条,第31-32条など)。
第5条は計画の目的について規定する。「個人情報は,研究および報道の必要を満たすために,計画において処理することができる」。
第6条は「センシティブ(訳注:特に注意を要する)個人情報」の処理について規定する。「個人情報保護法第13条にいうセンシティブ個人情報は,この政令第5条にいう目的を満たすために不可欠である場合に限り,計画において処理することができる」。個人情報保護法第13条のセンシティブ個人情報とは,人種,民族,政治信条,信教,思想,労働組合への加入,健康および性生活に関する個人情報をいう。
第7-10条は計画のためのデータベースについて規定する。「(第7条)国立図書館は,第5条に定める目的のために用いられる個人情報を,計画において自動処理により収集しデータベースとして保有することができる」。「(第8条)本データベースは,インターネット上で公開されたスウェーデンの資料中の個人情報のみを,計画に基いて処理することができる」。「(第9条)本データベース内の情報は,研究に用いることを目的とする場合に限り,自動処理のための媒体(訳注:CD-ROMなどの媒体)に転送することができる。国立図書館は,原価に相当する金額について,当該媒体の代価として料金を徴収することができる」。「(第10条)本データベース内の情報について,その直接の取得は,国立図書館内の端末を通してのみ,認められる」。
第11条は,検索語に関する規定である。「個人情報保護法第13条にいうセンシティブ個人情報および同法第21条にいう個人情報は,検索語としてこれを便用することはできない」。個人情報保護法第21条にいう個人情報とは,犯罪,犯罪事件に関する判決,刑事訴訟手続きによる処分又は行政手続きによる自由拘束に関する個人情報である。
第12条は訂正および損害賠償に関する規定である。「訂正および損害賠償に関する個人情報保護法の規定は,この政令に基づく個人情報の処理にこれを適用する」。個人情報保護法は適法に処理されていない個人情報について,被記録者による個人情報管理者への訂正請求を認めている(第28条)。また同法の規定に反して他人に対し損害を与えた場合や,人権侵害によって被記録者に損害を与えた場合には,その損害を賠償しなければならないとしている(第48条)。
第13条は提訴に関する規定である。「個人情報保護法第26条に基づく情報提供申請に対する国立図書館の訂正又は拒否の決定は,行政法(1986年法令第223号)第22条に定める一般行政裁判所にこれを提訴することができる」。個人情報保護法第26条は1暦年に1回,無料での,被記録者による個人情報管理者への情報提供申請を認めている。
以上の政令制定の効果についてスウェーデン国立図書館のトマス・リドマン(Tomas Lidman)館長は,「非常に長期的な視野に立ち国際的にも高く評価されている当館の計画が最終的に公式の承認を得ることができてうれしい」と述べている。
調査及び立法考査局社会労働課:井田 敦彦(いだ あつひこ)
Ref.
“Forordning (2002:287) om behandling av personuppgifter i Kungl. bibliotekets digitala kulturarvsprojekt”Rattsnatet. (online), available from < http://www.notisum.se/rnp/sls/lag/20020287.htm >, (accessed 2002-12-27).
Lidman, Tomas. “New decree for Kulturarw3 (Press release)”. Kungl. biblioteket. (online), available from < http://www.kb.se/Info/Pressmed/Arkiv/2002/020605_eng.htm >, (accessed 2002-12-27).
菱木昭八朗. スウェーデン個人情報保護法. 新聞研究. (582), 2000, 86-92.
菱木昭八朗. スウェーデンの新しい個人情報保護法について. 比較法研究. (61), 1999, 158-166.
村上泰子, 齋藤健太郎, 松林正己, 清水裕子, 井田敦彦. 欧州のウェブ・アーカイビング. カレントアウェアネス. 2003, (275), p.17-24.
http://current.ndl.go.jp/ca1490