デジタル化された書籍群は出版された書籍群全体を反映しているか:1830年代後半に英国諸島で出版された小説の書誌目録を用いた調査(文献紹介)

プレプリントサーバarXivに2020年9月1日付で、文献“What Library Digitization Leaves Out: Predicting the Availability of Digital Surrogates of English Novels”が公開されています。

この文献は、1836年と1838年に英国諸島で初めて出版された小説の書誌目録を利用し、図書館等がデジタル化した書籍群が、その母集団となる出版された書籍群全体を反映しているかどうかを調査したものです。筆者は米・インディアナ大学ブルーミントン校のAllen Riddell氏と、米・パデュー大学フォートウェイン校のTroy J. Bassett氏です。

調査では、書誌目録所載の書籍について、Internet Archive、HathiTrust、Google Books、英国図書館のデジタルコレクションでのデジタル化の有無を確認しています。調査の結果、デジタル化の対象資料には偏りが見られること、特に男性が執筆した小説や多巻形式で出版された小説は、他の種類の小説に比べデジタル化資料の利用可能率が高いこと等が判明したとし、前後の数十年や別ジャンルにおいても同様の傾向が見られる可能性を指摘しています。

なお、本文献の“6.1 Limitations”には、調査における制約事項や課題も記載されています。例えば著者らは、書誌学関係のプロジェクトに携わった経験を踏まえ、法定納本図書館としての歴史を有する英国図書館及び英・オックスフォード大学図書館(Google Booksプロジェクトに参加)の2館は調査対象とした小説の原本全てを所蔵している、という仮定の下で調査を行いました。しかし、一度所蔵された原本が亡失・破棄等により失われ、今は所蔵されていない可能性も考えうるとしています。

What Library Digitization Leaves Out: Predicting the Availability of Digital Surrogates of English Novels(arXiv.org)
https://arxiv.org/abs/2009.00513