CA1988 - 島根大学附属図書館デジタルアーカイブのIIIF Authentication API導入 / 青柳和仁

PDFファイル

カレントアウェアネス
No.346 2020年12月20日

 

CA1988

 

島根大学附属図書館デジタルアーカイブのIIIF Authentication API導入

島根大学附属図書館:青柳和仁(あおやぎかずひと)

 

 デジタル画像の相互運用のための国際規格International Image Interoperability Framework(IIIF;CA1989参照)(1)が国内外のデジタルアーカイブで近年普及してきている。IIIFでは、安定版としては4種類のAPIが機能別に規定されている(2)が、IIIF Image API とIIIF Presentation APIの2つの基本APIに対応していればIIIF対応のデジタルアーカイブとして運用することができる。島根大学附属図書館デジタルアーカイブ(以下「島大アーカイブ」)(3)では、2018年1月30日にこの2つの基本API(バージョンは2.1.1)に対応したシステムとしてリニューアルしており(4)(5)、国内のデジタルアーカイブでもこの2つの基本APIに対応したシステムが次々と公開されている(6)

 IIIF対応した後の島大アーカイブでは、2019年9月30日には画像の二次利用ライセンスを改定し(E2221参照)、島根大学のネットワークからのみ閲覧ができるコンテンツ(学内コンテンツ)を搭載した(7)。その後、2020年3月10日からIIIF Authentication API 1.0(8)に対応した認証コンテンツを搭載している(9)

 本稿では、国内外でもほとんど例がないと思われるIIIF Authentication API の導入事例を紹介する。

 

1. 島根大学附属図書館デジタルアーカイブの特徴

 島大アーカイブでは、島根大学が所蔵する資料だけでなく、山陰地域の博物館、図書館等の機関や個人が所蔵する資料についても、デジタル化したコンテンツを公開している。

 また、搭載しているコンテンツはアクセス制限の種類により以下のようなものがある。

 

  • 公開コンテンツ
    アクセスに制限はなく、インターネットを通じてどこからでもアクセスできるコンテンツ
  • 学内コンテンツ
    島根大学内のネットワークからのみアクセスできるように制限をかけているコンテンツ
  • 認証コンテンツ
    ID・パスワードによる認証を行ってからアクセスできるコンテンツであり、学内コンテンツのようなネットワーク上の制限はない

 

 内容的に一般に公開してよいコンテンツは公開コンテンツとして搭載しており、一般への公開がなじまないコンテンツについては、学内コンテンツや認証コンテンツとして搭載している。また、後述のとおり、IIIF Authentication APIは認証コンテンツにのみ導入している。

 

2. 認証コンテンツ搭載に至った背景

 認証コンテンツの搭載が必要となった背景には、以下の2つがある。

 1つ目は学外の機関や個人が所有している資料について、所有者の知らないところで資料を複写され、無断で商用その他の二次利用をされることを良しとしない意向や、画像がどのように利用されたかを知りたいという意向があり、そのような資料については公開範囲を学内に限定しても不十分であり、さらに厳しいアクセス制限が望まれたことである。学内コンテンツは、島根大学内のネットワークからであれば自由に閲覧や複写ができてしまうが、認証コンテンツであれば閲覧にあたって所定の手続きが必要であるため、複写が必要かどうか、誰がどのような目的で利用するかの確認が取れる。

 2つ目は、まだ資料の調査が不十分であったり、研究途中である資料についても、早い段階でデジタルアーカイブに搭載したいという図書館としての思惑であった。従来の流れとしては、まず資料の調査・研究を行い、調査・研究が完了してからデジタルアーカイブへ搭載するためのデジタル画像を作成(デジタル化)し、デジタル化したものをコンテンツとして搭載してきた。資料の調査・研究には時間が必要であり、特に大型のコレクションともなると数年の時間がかかる。そこで、資料の調査・研究よりも前に(もしくは並行して)デジタル化を行い、早い段階でデジタルアーカイブに搭載できれば、デジタルアーカイブでの公開までの時間短縮が図れる。しかし、調査・研究前の資料は、それが一般への公開にふさわしい内容のものであるかは不明であり、調査・研究の当事者である研究者にとっても研究前の資料が公開されることについては多くの場合好ましくないものと思われている。この問題は、認証コンテンツとして搭載することで、調査・研究を行うチームだけが閲覧できる状態となるため、解決できる。調査・研究が完了した後は、資料の特性等に応じて速やかにアクセス制限を変更して公開できるというメリットがあるほか、研究者にとっても自宅から資料を見ることができ、研究チーム全員が同時に一つの資料を見ることが可能となるため、研究活動の効率化にもつながる(10)

 また、認証コンテンツをIIIF Authentication API対応で実装した理由としては、IIIFの枠組みで規定されている仕組みであること、対応しているビューワーであればシームレスに認証して閲覧に移れることがあった。国内での前例は確認できなかったが、島大アーカイブが先進事例となり、他館でもIIIF Authentication API対応の事例が増えることを期待して意欲的に実装を試みた。

 

3. 島根大学附属図書館デジタルアーカイブのシステム構成について

 システムとしては、3種類のサーバによって構成されており、公開コンテンツと学内コンテンツの場合の処理は図1のような流れとなっている。

 

図1 システム構成(公開コンテンツ、学内コンテンツの場合)

 

 リバースプロキシサーバは、ブラウザ(ユーザ)と実際に処理をするサーバとの中継を行っており、ユーザからの画像データ要求(リクエスト)や画像データのinfo.jsonファイルリクエストを画像配信サーバへ、IIIF Manifestファイルやその他のリクエストをユーザフロントエンドサーバへ割り振っている。そのため、IIIF の文脈で言えば、画像配信サーバはIIIF Image APIに対応し、ユーザフロントエンドサーバはIIIF Presentation APIに対応した構成となっている。

 画像配信サーバはIIIF Image APIに対応したオープンソースソフトウェアのIIPImage Server(11)を使って構築している。一方のユーザフロントエンドサーバは、IIIF Manifestファイルの生成・出力や資料の検索機能等の役割を担っており、株式会社ENU Technologies(12)に構築を依頼したものである。

 学内コンテンツの場合、リバースプロキシサーバでユーザのリクエストが有効かどうかの判定が行われ、無効なリクエストにはHTTP ステータスコード403(「アクセス拒否」を意味するコード)のエラーが返される。

 

4. 認証コンテンツ搭載機能の実装方法について

 認証コンテンツへのアクセスについては、システムを構成するサーバは前述のものと同一であるが、認証機能をIIIF Authentication APIに準拠した仕組みで実装するために、処理の流れが異なる。

 IIIF Authentication APIでは、ユーザが未認証だった場合には、画像配信サーバ(IIIF Image API)が出力するinfo.jsonファイルについて、HTTPステータスコード401(「認証が必要」を意味するコード)を返しつつ、特定のJSON形式データを出力する必要があるが、IIPImage Serverでは、この処理を行うことができない。

 そのため、ユーザが認証コンテンツへのリクエストを行った場合、図2のように全てのリクエストをユーザフロントエンドサーバへ割り振り、ユーザフロントエンドサーバがリクエストと認証状態に応じてさらに中継を行って画像配信サーバへ処理を割り振っている。つまり、ユーザフロントエンドサーバが2段目のリバースプロキシサーバとして動作している。

 

図2 システム構成(認証コンテンツの場合)

 

 こうすることで、ユーザが未認証だった場合には、ユーザフロントエンドサーバ側でinfo.jsonファイルを生成し、これをHTTPステータスコード401と共にユーザに対してレスポンスすることで対応できるようにしている。そして、ユーザが認証済みの場合、ユーザフロントエンドサーバは、画像データやinfo.jsonのリクエストを画像配信サーバへ渡して中継を行い、ビューワーで画像が表示されるようになる。

 IIIF Authentication APIでは、アクセスCookieの発行方法の違いにより以下4種類の認証パターンがある。

 

  • Login
    ID・パスワードによる認証を経るとアクセスCookieが発行されるパターン
  • Clickthrough
    ブラウザに表示されるボタンをクリックするとアクセスCookieが発行されるパターン
  • Kiosk
    非対話的に自動でアクセスCookieが発行されるパターン
  • External
    外部のサービスにより既にアクセスCookieが発行されていることが前提となっているパターン

 

 島大アーカイブでは、ユーザ毎にアクセスできる認証コンテンツが異なり、ユーザID管理が必要であることや、シームレスで明示的なログインの手続きができる認証パターンが求められたため、これらのうち“Login”のパターンを採用している。その他のIIIF Authentication APIについての技術的な詳細は公開されている仕様を参照していただきたい(13)

5. 認証コンテンツの利用画面

 島大アーカイブでは、検索結果の表示画面等でも認証コンテンツであることがはっきりとわかるように、サムネイル表示では図3のような画像が表示されるようになっている。

 

図3 検索結果の表示画面

 

 これら認証コンテンツをIIIF Authentication API対応のビューワーで開こうとすると、図4のようなログイン要求のポップアップが表示される。

 

図4 未認証の場合の画面

 

 ここで“Login”ボタンをクリックすると図5のようなログイン用のタブ(又はウィンドウ)が開かれ、ID とパスワードを入力してログインする画面が表示される。

 

図5 ログイン画面

 

 ログイン完了後は、元のタブ(又はウィンドウ)に戻るようになっており、図6のように本来の認証コンテンツの画像が表示されるようになっている。

 

図6 認証後の画面

 

 これら一連の動きはIIIF Authentication APIによって規定されており、同APIに対応したビューワーであれば、同様に表示することができるようになっている。

 また、認証コンテンツであっても、書誌情報や二次利用ライセンス等のメタデータについてはログインの必要なく見ることができるようになっている。

6. おわりに

 デジタルアーカイブは、本来はコンテンツを一般に広く公開するためのシステムであることが期待されているため、アクセス制限のあるコンテンツの搭載は適さないという考えもある(14)。しかし、本稿で述べた背景のように、アクセス制限をしないと公開できない場合は、その資料の存在を示しながら、将来的に利活用される可能性が開かれるため、全く公開しないよりはアクセス制限がある状態でも公開することに意義があると思われる。

 IIIF Authentication APIは、IIIFの目的である相互運用性を確保しつつアクセス制限機能を実現する仕組みであるため、アクセス制限をせざるを得ない場合には、当館の事例が参考となって、他機関でもIIIF Authentication APIが導入されるようになれば幸いである。

 

(1) International Image Interoperability Framework™.
https://iiif.io/, (accessed 2020-10-07).
IIIFの全体像については以下に詳しい。
永崎研宣. 特集, デジタルアーカイブを支える技術:デジタル文化資料の国際化に向けて:IIIFとTEI. 情報の科学と技術. 2017, 67(2), p. 61-66.
https://doi.org/10.18919/jkg.67.2_61, (参照 2020-10-07).

(2) “API Specifications - International Image Interoperability Framework™” IIIF.
https://iiif.io/api/, (accessed 2020-10-07).

(3) 島根大学附属図書館デジタルアーカイブ.
https://da.lib.shimane-u.ac.jp/content/, (参照 2020-10-07).

(4) “新しいデジタルアーカイブを公開しました”. 島根大学附属図書館. 2018-01-30.
https://www.lib.shimane-u.ac.jp/new/2018013000038/, (参照 2020-10-07).

(5) 島根大学附属図書館デジタルアーカイブは2008年10月から運用している。
https://www.lib.shimane-u.ac.jp/menu/about/gaiyo/history/shimane_univ_library.html, (参照 2020-10-07).

(6) 国立大学図書館協会学術資料整備委員会デジタルアーカイブWG. 大学図書館におけるデジタルアーカイブの利活用に向けて. 国立大学図書館協会, 2019, p. 24.
https://www.janul.jp/sites/default/files/2019-07/sr_dawg_report_201906.pdf, (参照 2020-10-07).

(7) “デジタルアーカイブに学内限定コンテンツを搭載しました”. 島根大学附属図書館. 2019-12-10.
https://www.lib.shimane-u.ac.jp/new/2019100200089/, (参照 2020-10-07).

(8) “IIIF Authentication API 1.0”. International Image Interoperability Framework™.
https://iiif.io/api/auth/1.0/, (accessed 2020-10-07).

(9) “デジタルアーカイブに認証コンテンツを搭載しました”. 島根大学附属図書館. 2020-03-17.
https://www.lib.shimane-u.ac.jp/new/2020031000013/, (参照 2020-10-07).

(10) 研究段階に応じた認証コンテンツ搭載機能については、以下にも記述がある。
北本朝展ほか. IIIF Curation Platform:利用者主導の画像共有を支援するオープンな次世代IIIF基盤. じんもんこん2018論文集. 2018, 2018. p. 334.
http://id.nii.ac.jp/1001/00192395/, (参照 2020-10-09).

(11) “Server”. IIPImage.
https://iipimage.sourceforge.io/documentation/server/, (accessed 2020-10-07).

(12) ENU Technologies.
http://www.enut.jp/ja, (参照 2020-10-07).

(13) “IIIF Authentication API 1.0”. International Image Interoperability Framework™.
https://iiif.io/api/auth/1.0/, (accessed 2020-10-07).

(14) 例えば、以下の内閣府の報告書では、オープンなコンテンツを流通させるための基盤として、デジタルアーカイブを位置づけている。
デジタルアーカイブの連携に関する関係省庁等連絡会・実務者協議会. 我が国におけるデジタルアーカイブ推進の方向性. 内閣府知的財産戦略本部. 2017, p. 3-5.
https://www.kantei.go.jp/jp/singi/titeki2/digitalarchive_kyougikai/houkokusho.pdf, (参照 2020-10-09).

 

[受理:2020-11-12]

 


青柳和仁. 島根大学附属図書館デジタルアーカイブのIIIF Authentication API導入. カレントアウェアネス. 2020, (346), CA1988, p. 9-12.
https://current.ndl.go.jp/ca1988
DOI:
https://doi.org/10.11501/11596734

Aoyagi Kazuhito
Introduction of IIIF Authentication API at the Shimane University Library Digital Archive