Internet Archive(IA)はどのようにLPレコードをデジタル化しているのか(記事紹介)

Internet Archive(IA)の2019年10月23日付けブログ記事で、IAが進めているLPのデジタル化作業が紹介されています。著者は米・ニューヨークを拠点とするフリーランスのライター・Faye Lessler氏です。

IAでは、米・ボストン公共図書館との協力により、同館が所蔵する10万を超える音源のデジタル化を2019年に開始しました。音源は、蝋管、SPレコード、LPレコードなど様々な媒体に記録されています。

LPレコードのデジタル化作業では、最初にカバーアート、ディスク本体、付属資料の高精細画像の撮影と、レコードラベル、記録年、トラックリスト等のメタデータが作成されます。メタデータは様々な外部データベースとの照合によるクロスチェックが行われます。

続いて、IAが提携しているInnodata Knowledge Services社によって、フィリピン・セブ島にある同社の施設で音源のデジタル化作業が実施されます。12のターンテーブルで一枚ずつ、等倍速での再生によりデジタル化しており、作業量としては1時間あたり10枚程度となっています。

その後、LPの片面ごとにFLACフォーマットのファイルが作成され、収録曲の頭出しが出来るようにセグメント分けが行われます。セグメント分けに際しては、二つのアルゴリズムが採用されています。一つ目は、盤面の画像から読み取れる溝の隙間から曲間の区切りを推定するもの、二つ目は音声中の無音箇所を曲間の区切りと見なすものです。機械によるこれら二つの判定結果が一致した場合に、セグメント分けが適切に行なわれたと見なされ、その正確性は80%とあります。

ただ、ライブ音源のように曲間に聴衆の拍手が入っているもの、クラシック音楽のように静寂を曲の一部として用いるものなど、セグメント分けが難しいものもあり、公開までには必ずマニュアルチェックを経ていることが紹介されています。

How the Internet Archive is Digitizing LPs to Preserve Generations of Audio(Internet Archive Blogs, 2019/10/23)
https://blog.archive.org/2019/10/23/how-the-internet-archive-is-digitizing-lps-to-preserve-generations-of-audio/

関連:
Boston Public Library Vinyl LP Collection(IA)
https://archive.org/details/vinyl_bostonpubliclibrary
※IAによるボストン公共図書館所蔵LPレコードのデジタルアーカイブです。

参考:
Internet Archive(IA)、米・ボストン公共図書館(BPL)から移管されたSPレコードの音源をデジタル化して公開
Posted 2019年4月1日
https://current.ndl.go.jp/node/37916

米・ボストン公共図書館、同館所蔵の商業音楽コレクション(レコード類)をInternet Archiveに移管:デジタル化しての公開を計画
Posted 2017年10月12日
http://current.ndl.go.jp/node/34819