E2248 – 「過去のビッグデータ」を探る欧州タイムマシン研究計画

カレントアウェアネス-E

No.389 2020.04.23

 

 E2248

「過去のビッグデータ」を探る欧州タイムマシン研究計画

ROIS-DS人文学オープンデータ共同利用センター/国立情報学研究所・北本朝展(きたもとあさのぶ)

 

   1,000年以上の歴史が生み出した欧州の文化遺産に,革新的なデジタル化技術や人工知能(AI)技術などを適用することで,誰もがアクセスでき,欧州の文化産業や観光,教育などにも有用な「過去のビッグデータ(Big Data of the Past)」を作り出す。これが欧州タイムマシン(Time Machine Europe)プロジェクト(以下「TMプロジェクト」)の目標である。

   このプロジェクトの源流は,スイス連邦工科大学ローザンヌ校(EPFL)のカプラン(Frédéric Kaplan)氏が2012年に開始したVenice Time Machineプロジェクトにある。ヴェネチアは世界史上最長の共和国とも言われ,ヴェネチア公文書館には1,000年におよぶ様々な種類の文書や書籍などが残されている。これを大規模にデジタル化し,そこに書かれている内容を光学式文字認識(OCR)などで取り出し,そこから人物ネットワークや3次元都市構造などを復元することで,歴史研究の新しいプラットフォーム「タイムマシン」を構築することがプロジェクトの目標である。この構想はメディアなどでも話題となり,アムステルダムやパリなど欧州の他の都市でも同様の試みが始まった。

   やがて都市ごとのLocal Time Machine(LTM)の数が増加し,LTMの研究ネットワークも拡大したことから,TMプロジェクトはコンソーシアムを立ち上げ,研究規模を欧州全体に拡大するために大型研究計画への申請を行った。それが欧州委員会(EC)のHorizon Europe (2021-2027)におけるFET Flagshipsである。FET Flagshipsは10年間で10億ユーロ(約1,200億円)の予算を想定する超大型研究プロジェクトであるが,採択に向けた競争も激しく,現在のHorizon 2020(2014-2020)では全学術分野でたった3件しか採択されていない。TMプロジェクトは,応募したICT分野の厳しい競争を次々に突破してなんと最終候補6件(ICT分野は2件)に残り,2019年は本格研究の開始に向けて研究体制の整備に着手した。ECの次期計画は予算規模などに関して不透明な部分が残っているものの,TMプロジェクトが欧州を代表する研究計画とみなされたことは確かであり,それ自体が画期的なことと言える。

   TMプロジェクトのスケールは壮大である。2020年2月現在,プロジェクトには600以上の機関,6,000人以上の専門家が関わっている。またEuropeanaとは,技術的基盤(IIIFやメタデータモデル等),法的基盤,そして利用者駆動型基盤などに関する連携を始めている。研究計画では,AIや革新的スキャン技術,バーチャルリアリティなど新たな情報技術の研究開発を通して,人文社会分野の研究にもイノベーションをもたらすことを目指している。また文化産業や観光などとの連携で経済的価値が生じることも強く訴えており,学術研究にとどまらず産学連携などを通じた社会的なインパクトも重視している。さらに教育や図書館・博物館・公文書館といったGLAMでの活用,災害への備え,米国企業が支配する情報プラットフォームへの依存低減など,研究計画には多彩な課題が盛り込まれている。

   TMプロジェクトが旗印に掲げるフレーズが,過去のビッグデータである。過去の文化遺産を様々な方法でデジタル化すること自体は従来から行われてきたが,こうしたデジタル化プロセスを最新技術で革新するだけでなく,OCR,自然言語処理,画像処理などのAI技術も研究開発することで,過去の世界を機械可読な形式としてデータ化することを目標とする点が「過去のビッグデータ」の特徴である。この考え方をさらに進める野心的な構想が「歴史シミュレータ」と「4次元ミラーワールド」である。まず歴史シミュレータは,過去のビッグデータの時系列データを時系列モデルに入力することで,未来を見ることができるようにするという構想である。さらに「4次元ミラーワールド」は,現実世界をサイバー空間に再現する「ミラーワールド」を過去と未来に延長することで,サイバー空間中で歴史を調べることができるようにするという構想である。このような考え方の背景には「過去のビッグデータを未来の欧州に役立てたい」という意思がある。過去のビッグデータは,過去を研究するための資源になるだけでなく,歴史に学んで未来に活かすための資源にもなるのである。

   それにしてもICT分野で文化遺産のプロジェクトが選ばれたという結果には意外感があり,Natureの記事でも”Surprise Selection”との表現が使われている。なぜこのプロジェクトは高い評価を受けたのだろうか。以下はあくまで私見であるが,このプロジェクトが未来への不透明感が漂い始めた欧州の人々の琴線に触れたからではないかと考えている。英国の欧州連合(EU)からの離脱(”Brexit”)の混乱によってEUの理想が揺らぎ始めた2019年,そして新型コロナウイルス感染症(COVID-19)の拡大によって文化を含む社会活動が麻痺している2020年,「欧州とは何なのか」というアイデンティティを問い直すには歴史の振り返りが欠かせない。TMプロジェクトが歴史への新しいアクセス方法を提供し,文化遺産という欧州の誇りを世界で広く共有できるようになれば,欧州の文化産業や観光の復活にも貢献できるかもしれない。ROIS-DS 人文学オープンデータ共同利用センターでは,TMプロジェクトとは独立に「歴史ビッグデータ」プロジェクトやEdo Time Machine構想を進めているが,AI技術の研究開発によって過去のビッグデータを生み出し,その分析から未来に向けた知見を得るという目標は同じである。歴史を探る新しいツールとしての「タイムマシン」というコンセプトが,これからどのような発展を遂げるかに注目したい。

Ref:
Time Machine Europe.
https://www.timemachine.eu/
“Time Machine Manifesto”. Time Machine Europe. 2019-05.
https://www.timemachine.eu/wp-content/uploads/2019/06/Time-Machine-Manifesto.pdf
“Time Machine CSA: The End is Just the Beginning : Time Machine Europe”. Time Machine Europe. 2020-02-27.
https://www.timemachine.eu/time-machine-csa-the-end-is-just-the-beginning/
“FET Flagships | Shaping Europe’s digital future”. EC.
https://ec.europa.eu/digital-single-market/en/fet-flagships
“Europe’s next €1-billion science projects: six teams make it to final round”. Nature. 2019, (566), p.164-165.
https://doi.org/10.1038/d41586-019-00541-y
Daley, Beth. “Europeana and Time Machine join forces for a partnership promoting the future of European cultural heritage”. Europeana Pro. 2019-12-16.
https://pro.europeana.eu/post/europeana-and-time-machine-join-forces-for-a-partnership-promoting-the-future-of-european-cultural-heritage
TEDx Talks. “The Venice Time Machine: Frederic Kaplan at TEDxLakeGeneva”. YouTube. 2014-05-14.
https://www.youtube.com/watch?v=b6nfoE9ly90
nature video. “A virtual time machine for Venice”. YouTube. 2017-06-14.
https://www.youtube.com/watch?v=uQQGgYPRWfs
Time Machine. “Time Machine – A Common History for the Continent”. YouTube. 2019-03-27.
https://www.youtube.com/watch?v=UlvTARiC5fM
“「歴史ビッグデータ」プロジェクト”. ROIS-DS人文学オープンデータ共同利用センター.
http://codh.rois.ac.jp/historical-big-data/