E1916 – 情報の分散記述と共有をうながすWeb Annotation

カレントアウェアネス-E

No.325 2017.05.25

 

 E1916

情報の分散記述と共有をうながすWeb Annotation

 

 ウェブ上での注釈(アノテーション)の表現方法を標準化するWeb Annotation(以下WA)が2017年2月にWorld Wide Web Consortium(W3C)の勧告となった。仕様は,注釈の表現方法であるデータモデル(WA Data Model),この注釈モデルをRDFで記述するための語彙(WA Vocabulary),および注釈の取得や管理のためのアプリケーションのやり取りを定めるプロトコル(WA Protocol)の3つから成る。

 注釈はウェブ上での共同作業や知識共有の手段として早くから注目されていた。1995年にW3Cのワークショップを受けて議論のためのメーリングリストwww-annotationが開設され,2000年には注釈をウェブで共有するためのサーバー,ツールや語彙の開発も含むAnnoteaプロジェクトが始まっている。2009年に発足したOpen Annotation Collaborationが新しい技術動向をふまえたモデル構築に取り組み,これを発展させたW3CのWA作業部会によって今回の標準化が成し遂げられた。最初のメーリングリストまで遡ると,20年以上かけてようやくその期待が具現化されたことになる。

 書物では,自著への注はもとより,外部の資料や情報への言及も引用という形で,注釈対象と注釈内容が一体化される。これに対してウェブでの注釈は,両者を完全に独立したものとして扱う。注釈対象は別組織のリソースであってよいし,注釈内容も図表を含めた論文や動画による説明など異なるメディアでもかまわない。仕様では注釈を「個別の情報の間に連関を生み出すこと」としており,知識や情報を分散記述しながら共有可能とする仕組みが提供されることになる。

 このためにWAモデルでは,注釈対象(target)と注釈内容(body)をそれぞれURIで指し示す。識別子だけでなく画像や動画のフォーマットなどの情報も合わせて提供する場合は,値を構造化して必要なプロパティを追加する(注釈内容がテキストなら,URIで参照せずvalueプロパティに直接記述してもよい)。

 注釈対象は,文章のフレーズや画像の特定領域など,リソース全体ではなくその一部であることが多い。この場合は,targetにセレクタ(selector)を加えてその部分を示す。このセレクタには,文書のツリー構造を利用して段落等を指定するXPathや,画像や音声・動画の特定部分を指し示すメディア・フラグメントなどが利用できる。テキストについては,文字位置だけでなく前後の文字列を保持するセレクタも用意し,小さな変更であればそれを参考に対象範囲を補正できるようにした。対象の性質に応じたセレクタは,多様なメディアに対応するウェブの注釈モデルならではの特徴といえる。

 WA仕様はJSON-LD(JSONのプロパティやオブジェクトの識別にURIを用い,さらに「コンテクスト」と呼ばれるマッピングでそのURIを簡潔に記述できるようにしたもの)によってデータモデルを示している。ウェブアプリケーションで利用しやすいことに加え,JSONを用いることが多い既存の注釈ツールとのデータ交換が容易になると期待される。またJSON-LDコンテクストでWA語彙との対応関係が定義されており,注釈をRDFグラフに変換し,さまざまなデータと組み合わせることができる。

 JSON-LDコンテクストによる変換は,同じWA語彙のRDFグラフであっても,アプリケーションに合わせて異なるJSON構造を定義・採用できるというメリットももたらす。たとえばデジタル画像の相互運用規格として注目されているIIIFの表現APIは,WAモデルに基づきつつ,ビューアなどのツールでの表現に必要な形に組み替えた,独自のJSON-LDコンテクストを用いている。

 注釈対象をURIで識別するRDFモデルにより,同じ対象に関する複数の注釈を集約し,かつそれぞれの来歴を管理できる点は,特に注目しておきたい。博物館の論文検索や「美術図書館横断検索」,書評の検索サイトなどさまざまな機関やサービスで,一つの作品に対する関連資料を網羅したり,利用者のコメントを加えて提供したりといった試みが行なわれている。これらも注釈と考えてWA語彙で表現(あるいはマッピング)すれば,各機関が積み上げた情報を連動させることが可能になるだろう。もちろんそのためには,同じ対象が同じURIで識別されていることが前提であり,URIを共有することの重要性を改めて考えさせるものでもある。

ゼノン リミテッド パートナーズ・神崎正英

Ref:
https://www.w3.org/TR/annotation-model/
https://www.w3.org/TR/annotation-vocab/
https://www.w3.org/TR/annotation-protocol/
https://www.w3.org/2001/Annotea/
http://www.openannotation.org/
https://www.w3.org/TR/media-frags/
https://www.w3.org/TR/2014/REC-json-ld-20140116/
http://iiif.io/api/presentation/2.1/
E1613