E2272 – データサイエンス,機械学習,AIの責任ある運用のために

カレントアウェアネス-E

No.393 2020.06.25

 

 E2272

データサイエンス,機械学習,AIの責任ある運用のために

電子情報部電子情報サービス課・牛尾響(うしおひびき)

 

   2019年12月,OCLC Researchはポジションペーパー “Responsible Operations: data science, machine learning, AI in libraries” を発表した。近年,データサイエンス,機械学習,人工知能(AI)といった大量のデータに基づいた判断処理を可能とするアルゴリズムによる手法への注目が集まっている。これらの技術は,例えば蔵書点検業務の自動化や,利用者の情報発見支援などの領域で用いられ始めている。本ペーパーは,図書館コミュニティでのデータサイエンス,機械学習,AIの運用方針決定に貢献することを目的としており,米国を中心とした70人を越える図書館員や大学・美術館・博物館などの組織の専門家からなるグループの協力のもとで作成された。

   本ペーパーでは図書館(特に研究図書館)がこれらの技術を利用するために取り組むべき技術的・組織的・社会的な18の課題を扱っている。課題は「責任ある運用への関与」,「書誌記述と発見」,「手法とデータの共有」,「機械処理可能なコレクション」,「人材開発」,「データサイエンスサービス」,「専門職間,学際的な連携の維持」の7つの領域に整理され,議論と行動の出発点となる提案とともにまとめられている。それぞれの課題は単独で解決することのできない相互依存的なものであり,中でも「責任ある運用への関与」という基礎を欠くことはできないと述べられた。

   タイトルにもなっている「責任ある運用(Responsible Operations)」は,技術倫理的な概念に由来しているという。人間の情報収集・判断に役立てられることや,自動化された作業の過程や責任が不明瞭になりうることから,これらの技術の運用には注意が払われる必要があると言われている。これらの技術のアルゴリズムによる分析・判断は,一見客観的なものに見えるかもしれないが,その構築過程で用いられたデータの範囲や特性を反映している。本ペーパーでは,元々のデータやモデルに含まれていたバイアスが増幅され,図書館職員や利用者,より広くは社会に対して悪影響を与えてしまうことへの懸念がとりわけ強調されている。

   以下では,特に重要と思われる3つの課題について紹介する。

●バイアスのマネジメント(「責任ある運用への関与」)

   歴史・言語的に構造化されてしまった偏見や,周縁化されたコミュニティの側に立った史料が少ないことなどが要因となって,データやこれに基づいたアルゴリズムにはバイアスが存在する。これらは,図書館のコレクション形成や書誌記述のバイアスと同じく,周縁化されたコミュニティに害をなしうることが指摘されている。これに対して,バイアスのマネジメントに関するシンポジウムを開くこと,失敗例も含めて事例を交換すること,この問題に取り組むためのワーキンググループを作ることなどが提案されている。単一的な文化の中ではバイアスを適切に扱えないこと,職員の多様性は選択肢ではなく義務であることにも触れられている。

●手法の形成や流通の共有(「手法とデータの共有」)

   新聞記事画像,視聴覚資料の処理など,アルゴリズムによる手法を適用することでコレクションの発見やアクセスが向上するにもかかわらず,このような手法はまだ十分に広がっていないという。参入者を増やし業務を改善するために,手法やデータを共有していくべきだと述べられている。提案として,機械学習やAIの手法および評価基準を共有するための会合,公表の場や資金源を増やすこと,文化遺産的な題材に特化したコンペを開催するプラットフォームを作ってみること,専門職・学協会の内外でこのような手法について研究するグループを立ち上げることなどが挙げられた。

●組織内部の人材への関与(「人材開発」)

   新たな技術や革新は,組織の外から来た職員の担当領域とされがちで,職員の能力に不均一が生じやすいと指摘されている。メンター制度,教育,経験の機会,そして学んだことを活用できる道筋を示すことで,組織内の人材を育てる必要があると述べられている。この課題に対し,縦割り主義を避けて,中心的な業務と新たな業務を統合するような組織のあり方を探るためのワーキンググループを形成することが提案されている。これにより,時とともに組織の多様化や技術の深化が促されるという。

   責任ある運用を行うためには,縦割り主義ではない組織全体による関与,建設的な議論や異議申し立てが可能な組織づくりが必要だという。また,本ペーパーで扱われた課題を達成するためには,司書や図書館だけではない専門や組織の垣根を越えた協働が求められることが指摘された。このため,読者には図書館の職員・管理者だけではなく,大学や他の組織の専門家,図書館への資金提供者もが想定されている。

   本ペーパーは米国の状況を前提として検討されたものであるが,日本の図書館コミュニティにおいてもこれらの技術についての方針を策定する一助となるだろう。

Ref:
Padilla, Thomas. Responsible Operations: Data Science, Machine Learning, and AI in Libraries. OCLC Research, 2019, 35p.
https://doi.org/10.25333/xk7z-9g97
“Works in Progress Webinar: Responsible Operations-Shaping a Community Research Agenda for Data Science”. OCLC Research.
https://www.oclc.org/research/events/2020/011420-shaping-a-community-research-agenda-for-data-science.html
Apte, Poornima. “The Data Scientist Putting Ethics Into AI”. OZY. 2017-09-25.
http://www.ozy.com/rising-stars/rumman-chowdhury-the-human-centric-thinker/81044
Kennedy, Mary Lee. “What Do Artificial Intelligence (AI) and Ethics of AI Mean in the Context of Research Libraries?”. Research Library Issues, 2019, (299), p. 3-13.
https://doi.org/10.29242/rli.299.1