カレントアウェアネス
No.336 2018年6月20日
CA1930
スタンフォード大学東アジア図書館の
日本に関する試験的ウェブアーカイブ・プロジェクトの2年間の歩み
スタンフォード大学東アジア図書館:リーガン・マーフィ・カオ
スタンフォード大学東アジア図書館:五十嵐由実(いがらし ゆみ)(翻訳)
The Original (Written in English)
ゆく河の流れは絶えずして、しかも、もとの水にあらず。淀みに浮かぶうたかたは、かつ消えかつ結びて、久しくとゞまりたる例なし。世中にある、人と栖と、またかくのごとし(1)。
While the river’s current is ceaseless, the passing water constantly changes. The bubbles that form on its surface, form and burst, never lasting long. People and their dwellings are the same(2).
鴨長明(1155?-1216)は、随筆『方丈記』の冒頭で、世の移りゆくもののはかなさを川の流れや水の泡に例え、世の無常を語った。歴史学者は、時の流れの刻みに基づいて、過去の出来事を叙述しようと努めるが、図書館司書は、現時点において様々な価値を多角的に垣間見ることができる主要な情報と資料を保存しようと努める。ところが、更新や削除が頻繁に行われるウェブサイトの登場で、常に変化する状況下での収集や保存のプロセスの流れが急激に速くなり、一瞬における多種多様な発言と視点を保存する必要性がよりいっそう高まってきた。
このような問題意識の下で、米・スタンフォード大学東アジア図書館の日本に関するウェブアーカイブ・プロジェクトが開始した。当時、筆者は、貴重な発言を記録し、歴史に埋もれがちな発言の一部が確実に保存されるために多様なテーマを集めたウェブアーカイブのプロジェクトが必要だと考えた。ウェブサイトの選定においては、国立国会図書館や他機関で既に実施されているウェブアーカイブの収集を補完すること(重複しないように)を目指した(3)。ここで、筆者がこの試験的プロジェクトを立ち上げてから2年間で学んだいくつかの点と現在に至るまでの経過について説明する。
現代の日本社会の研究の現状を踏まえ、多様なニュースメディアで繰り返し取り上げられている話題を考慮し、ウェブアーカイブチーム(4)は、雇用、エネルギー、ロボット開発など現在の社会で重要な話題を選定し、テーマ毎に関連する多数の収集候補のウェブサイトリストを作成した。そして、全国各地に存在する小規模な機関から国際的な機関に至るまでのうち、活発に更新されているサイトに絞り込んだ。その後、ウェブサイト管理者に協力を依頼する通知レターを送付し、また、希望があればアーカイブの対象から外すオプションがあることも追記した。当チームは、しばらくの間、アーカイブに関する多数の問い合わせに応え、さらに理解を深めてもらうために当大学のウェブサイトに具体例を示した説明文を掲載した(5)。作業手順としては、米国に拠点を置く非営利団体Internet Archive(IA)が提供しているArchive-Itというウェブアーカイビングサービスにサブカテゴリー毎に選出したウェブサイトを登録し、次に収集頻度(毎月、四半期毎、または1回のみ)を決め、テストを行った。その後、アーカイブのデータサイズやキャプチャーイメージの品質の調整を行った。このようにして、アーカイブ・コレクションを構築する過程は、2年間にわたって続けられ、その間、新しいテーマの案が浮上する度にウェブサイトを随時追加していった。広範囲にわたる様々な情報・発言が網羅されるように、テーマ毎に少なくとも10のウェブサイトを収集するように努めた。テーマ別のグループとサブカテゴリーは次のとおりである(括弧内はウェブサイトの数)(6)。
- 政治・経済 (54):政党、金融機関、政治家、TPP、安全保障
- 雇用・労働 (46):労働組合、協同組合、若者の非正規雇用状況、在宅ワーク
- 社会関連 (156):超高齢社会、沖縄問題、女性支援、夫婦別姓、食品廃棄、赤ちゃんポスト、引きこもり、国際支援、LGBTQ、社会に影響力のある人物、地方創生、町並み保存、2020年東京オリンピック、ブログランキング(政治)
- 子育て・出産(29):待機児童、認可保育園、卵子凍結
- 学問・人文(41):高等教育機関、大学(法学部、経済学部、社会学部)、宗教
- 環境・自然(75):資源・自然エネルギー、反原発、地球温暖化、原子力関連機関
- 科学技術(41):ロボット、先端素材、研究機関
- インターネット・コンピューター(30):ネットハラスメント、サイバーセキュリティー
また、現行のウェブサイトとの混同を避けるため、アーカイブされたウェブサイトを一般公開するまでに最低6か月間の保留期間を設けた。次のステップでは、各サイトのメタデータを作成し、それらのデータがデジタルリポジトリに取り込まれ、その後、当大学の検索ポータルサイト SearchWorks(7) において、どこからでも閲覧が可能になる。予定では、2018 年晩秋に世界中から閲覧可能な、日本のウェブアーカイブ・プロジェクトに焦点を当てたオンライン展示会を計画している。
筆者は、このプロジェクトを通して大変多くのことを学んだ。特に、今は亡き小林麻央氏のブログをアーカイブしたと公表した(8) 時には、世間から大きな反響を得、とても心が動かされた。また、ウェブサイト管理者からお礼のメールを数々受け取り、中にはより一層活動に精進するという内容もあり、大変恐縮した。このようなことは、今まで筆者が取り組んできたどのプロジェクトにも見られない反応だった。
当時、図書館司書として、できる限り後世に正確な描写を伝える歴史的な瞬間の資料や情報を残そうと努めていた。しかしながら、プロジェクトが進行するにつれて、ウェブサイト管理者が当プロジェクトの意図とは違う方向に解釈していることに気づき始めた。当プロジェクトは、特定のウェブサイトにターゲットを絞って収集する「選択的収集」を行っているため、あらかじめウェブサイト管理者に通知レターを送付する必要がある。現在の日本の社会の中で浮かび上がる様々な情報、発言を網羅することを目指していたにもかかわらず、通知レターを受け取ったウェブサイト関係者の一部は、当大学が彼らの活動、発言を公認しているかのような反応を示した。
そのため、当プロジェクトは、特定の団体・機関の活動を支持するものではないことを明確にする趣旨を通知文に付け加えた。さらに、この問題を感じ取ったことで、当チームは、プロジェクトのあり方を改めて問うようになった。米国に拠点を置く大学図書館としての社会的な立場を考慮すると、インターネット上で活発に語られる熱心な発言を公認するような姿勢を控えなくてはならない。このような場合、ウェブサイト管理者に通知するのではなく、IA が提供している Wayback Machine(9)というサービスを使用する方法を選んだ。これらのウェブサイトは、Wayback Machineに保存され、SearchWorksには表示されない。しかしながら、当アーカイブは熱心な議論の一部を間接的に収集して、後世の研究者が主要課題の情報を参照できるようにした。
ウェブアーカイブ“Snapshot of Japan, 2016-2018”は、ウェブアーカイブのための「スナップショット」モデルとなり得る試行プロジェクトであった(10)。当チームは、今までアーカイブされていなかった多くの重要なテーマのウェブサイトを収集・保存することを成し遂げ、多種多様な情報・発言の存在を実証することに成功した。これらは、様々な面での努力なくしては、歴史の描写から外れることになったであろう。
筆者は、このプロジェクトについて考える時、いつも鴨長明の言葉が心に浮かぶ。彼は、人々やその住処もまた川の流れや水の泡のようなものであると例えた。同じように、時代の流れに合わせて、日々更新・削除が頻繁に行われるウェブサイトは、川の表面に現れては消える水の泡に例えられる。そして、今までの緩やかな川の流れが ウェブサイトの登場によって、よりいっそう速い流れとなった。もし、彼が現在の無常観を心に描くなら、このはかない流れの速さに大変驚いたことであろう。情報の湧き出るのが速く、また変化が激しい時代の流れが続くのであれば、図書館司書の役割はいっそう重要になってくる。私たち司書としての使命、それは時の流れの中に埋もれがちな様々な情報や資料を収集、保存、そして提供することである。
歴史を語る、それは一つの視点からではなく、時の流れの中で記された多彩な情報や資料にもとづいて。
謝辞
当プロジェクトに同意して下さったウェブサイト関係者の皆様、そして当プロジェクトのために資金を提供して下さった当大学の The Freeman Spogli Institute for International Studies(FSI)と図書館に深く感謝を申し上げる。
(1)鴨長明, 吉田兼好著, 西尾實校注. 方丈記. 徒然草. 岩波書店, 1957, p. 23, (日本古典文學大系, 30).
(2)筆者による『方丈記』冒頭の英語訳。
(3)プロジェクトの開始当初は、当館と関係がある研究分野の教授らに収集対象テーマの相談を求めた。彼らのアドバイスにより初期のアーカイブ・コレクションが構築されたが、多くのテーマが既に国立国会図書館によってアーカイブされていた。したがって、プロジェクトが進行するにつれて、当プロジェクトの在り方を改めて問うようになった。結果、ある歴史的瞬間を多種多様に描写でき、またなるべく他機関と重複しないテーマに焦点を当てるようにした。また、6か月の保留期間内では、他機関がアーカイブしているかどうか確認することが常に可能なわけではなかった。
(4)当プロジェクトは、スタンフォード大学図書館の関連職員の方々による協力を得ながら、筆者ら二人のチームで取り掛かった。
(5)“Snapshot of Japan 2016-2018”. Stanford Libraries.
https://library.stanford.edu/eal/japanese-collections/japanese-collection-news/snapshot-japan-2016-2018, (accessed 2018-04-01).
(6)ウェブサイトの数は2018年5月現在である。
(7) Stanford Digital Repositoryでのアーカイブされたウェブサイトの表示例は次のとおりである。
http://purl.stanford.edu/hm701kx7587, (accessed 2018-04-01).
http://purl.stanford.edu/cv228rc9730, (accessed 2018-04-01).
(8)“Preserving the ephemeral: reflections on archiving Japanese websites”. Stanford Libraries. 2017-08-01.
https://library.stanford.edu/blogs/stanford-libraries-blog/2017/08/preserving-ephemeral-reflections-archiving-japanese-websites, (accessed 2018-04-01).
(9)IAによって開発された Wayback Machine は、どのユーザーも「ページ保存(Save Page Now)」ボックスからウェブサイトの登録ができる。
http://archive.org/web/, (accessed 2018-04-01).
当プロジェクトに適さないけれども歴史的に重要だと認識されたウェブサイトに関して、時折この機能を利用した。
(10)専門家によって実施されているウェブアーカイブ・プロジェクトの一般的な形態は、単一のテーマ、イベント、あるいはコンテンツタイプ(ブログやニュースメディアなど)を選定することである。
一方、「スナップショット」モデルは、当チームが現在の日本社会の多様な分野において、歴史的に重要なテーマを選定し、後世の研究者らが垣間見れるように収集・保存することが目的である。
Brügger, Niels. Web 25: Histories from the First 25 Years of the World Wide Web. New York, Peter Lang, 2017, 258p.
Brügger, Niels. Web History. New York, Peter Lang, 2010, 362p.
Lepore, Jill. The Cobweb: Can the Internet be archived?. The New Yorker. 2015, 2015-01-26.
https://www.newyorker.com/magazine/2015/01/26/cobweb, (accessed 2018-04-01).
Murphy Kao, Regan. “Preserving the ephemeral: Reflections on archiving Japanese websites”. Stanford Libraries Blog. 2017-08-01.
https://library.stanford.edu/blogs/stanford-libraries-blog/2017/08/preserving-ephemeral-reflections-archiving-japanese-websites, (accessed 2018-04-01).
Niu, Jinfang. An Overview of Web Archiving. D-Lib Magazine. 2012, 18(3-4).
https://doi.org/10.1045/march2012-niu1, (accessed 2018-04-01).
Webster, Peter. “Users, technologies, organisations: Towards a cultural history of world web archiving”. Web 25: Histories from the First 25 Years of the World Wide Web. Niels Brügger ed. New York, Peter Lang, 2017, p. 179-199.
[受理:2018-05-22]
リーガン. スタンフォード大学東アジア図書館の日本に関する試験的ウェブアーカイブ・プロジェクトの2年間の歩み. カレントアウェアネス. 2018, (336), CA1930, p. 20-22.
http://current.ndl.go.jp/ca1930
https://doi.org/10.11501/11115319
Regan Murphy Kao
Translation: Igarashi Yumi
A Snapshot Model for Web Archiving: Stanford East Asia Library’s Japanese Web Archive