検索

Gallicaの画像検索ツールGallicaPix(記事紹介)

2021年6月21日付で、フランス国立図書館(BnF)の電子図書館“Gallica”が、画像検索ツールである“GallicaPix”を紹介する記事をブログに掲載しました。

人工知能、光学文字認識(OCR)、資料の構造を光学的に認識する技術を用いたツールであると述べられています。また、記事では、人や物をはじめとした画像を構成する要素である「コンセプト(Concepts)」や、測色を活用した検索機能による探索方法の他、現在提供されているコーパスとして以下の5つが紹介されています。

・14-18
第一次世界大戦に関するものを中心に、約22万件の多様な画像で構成されています。

・Publicités 14-18
1910年から1920年にかけての広告の画像6万5,000件以上で構成されています。

・Papiers peints et textiles
英国国立公文書館(TNA)とGallicaの連携の成果であり、壁紙や織物の画像3,700件ほどが提供されています。

・Vogue
雑誌“Vogue”のフランス語版の1920年から1940年に刊行された号に掲載された画像で構成されています。

E2334 - 米国議会図書館の検索ツールNewspaper Navigatorについて

2020年9月15日,米国議会図書館(LC)は,米国の歴史的な新聞に掲載された写真等を探すための検索ツール“Newspaper Navigator”を公開した。このツールは,LCのInnovator-in-Residenceプログラム(以下「IIR」)の一環として,米国のワシントン大学博士課程のリー(Benjamin Charles Germain Lee)氏が作成したものである。IIRは,専門的な知見を持った個人を短期的に招き,LCが保有する資源の革新的かつ創造的な活用を支援するプログラムである。具体的には,アートや,インタラクションデザイン,デジタル人文学,データジャーナリズム等の分野でのプロトタイピング等の実施が想定されている。リー氏はIIRの2020年度の採択者である。

米国議会図書館(LC)、歴史的な新聞に掲載されている写真の検索ツール“Newspaper Navigator”を公開

2020年9月15日、米国議会図書館(LC)は、歴史的な新聞に掲載されている写真の新たな検索ツール“Newspaper Navigator”を公開したことを発表しました。

検索対象は、“Chronicling America”で公開されている、1789年から1963年にかけての歴史的な新聞に掲載された写真150万枚です。キーワードを入力して画像を検索し、検索結果の中から選んだ画像の関連画像を検索すること等が可能です。

同ツールは機械学習の技術を用いてLC Labsにより開発されたものであり、使用されたコードは全てオープンソースかつパブリックドメインで公開されています。

NDLラボ、「次世代デジタルライブラリー」の画像検索対象の拡大・機能追加等を実施

2020年8月31日、国立国会図書館のNDLラボは、ウェブサイトで公開中の「次世代デジタルライブラリー」について、画像検索の対象が拡大し機能等の追加が行われたことを発表しました。

NDLラボは、「次世代デジタルライブラリー」の改善点として、以下の3点を挙げています。

・「国立国会図書館デジタルコレクション」でインターネット公開中の著作権保護期間が満了した約33万6,000点の図書及び古典籍のデジタル化資料の全ての図版等へ画像検索の対象が拡大(ただし、全文テキスト検索の対象は従来同様NDC6類の資料のみ)
・切り出された図版の内容に関連するタグ付与・絞り込み検索機能の追加
・Webブラウザ上で実行する余白の自動切り出し機能の追加

また、従来から提供しているページ分割機能や紙面の白色化機能などの実験的機能も、全資料について引き続き利用することができます。

「次世代デジタルライブラリー」の検索対象の拡大等のお知らせ(NDLラボ,2020/8/31)
https://lab.ndl.go.jp/news/2020/2020-08-31/

検索結果の公平性を向上させるアルゴリズム(記事紹介)

2020年8月17日、米国のコーネル大学のニュースサイトである“Cornell Chronicle”で、検索結果の公平性を向上するための動的なランク学習(Learning to rank)アルゴリズム“FairCo”に関する記事が掲載されました。

発表によると、同大学の研究者らにより、検索結果の表示に用いられるランキングについて、利便性や関連性を損なわずに公平性を向上するために開発され、関連度が同等の項目については、ほぼ平等に表示されるとされています。

同アルゴリズムについてまとめた論文では、ニュースフィードのデータを用いた “FairCo”の公平性に関する検証結果等が記載されています。

Algorithm improves fairness of search results(Cornell Chronicle, 2020/8/17)
https://news.cornell.edu/stories/2020/08/algorithm-improves-fairness-search-results

「NDLラボ」のウェブサイトと「次世代デジタルライブラリー」がリニューアル

2020年3月31日、国立国会図書館の「NDLラボ」は、ウェブサイトのリニューアルを発表しました。

NDLラボは、次世代の図書館システムの開発に資する要素技術の実証実験を行うためのウェブサイトです。今回のリニューアルでは、全体的にカテゴリ分けを見直すとともに、アクセシビリティに配慮して画面デザインを一新しています。

また、2020年3月27日には、NDLラボのウェブサイト上で公開されている「次世代デジタルライブラリー」のリニューアルも発表されています。改善点は以下のとおりです。

・手元の画像や、その場で描いたイラストから似た画像を検索できる機能「手元の画像から検索」・「おえかきから検索」の追加
・従来までの産業分野(NDC6類)の図書に加え、技術・工学(NDC5類)、芸術・美術(NDC7類)の図書を検索対象に追加(ただし、全文テキスト検索の対象は従来同様NDC6類の資料のみ)
・各種ユーザーインターフェースの改善

Brill社、中国の視覚文化にあわせて設計されたシソーラス“Chinese Iconography Thesaurus”をオンラインで公開:シソーラスを用いた図像検索も試行可能

2019年12月12日、オランダの学術出版社Brill社は、シソーラス“Chinese Iconography Thesaurus”(CIT)のオンライン公開を発表しました。

CITは中国の視覚文化にあわせて設計されたシソーラスであり、英・ヴィクトリア&アルバート博物館の中国コレクションを担当する上級キュレーター・Hongxing Zhang氏らによるグループにより作成されました。現時点では、主に19世紀以前の情報源から抽出された語彙1万語を含んでいます。

作成に至った背景として、欧州の芸術に関する図像への索引付与等には伝統的にイコノグラフィー(図像学)の成果が用いられてきたこと、代わりとなる分類の欠如から、非西洋の芸術に対してもそのような欧州の芸術を基準とした分類が採用されてきたことを挙げています。

CITのウェブサイトはBrill社が構築・運営を行っており、英語・中国語での表示に対応しています。ウェブサイト上には、シソーラス本体以外にもシソーラスを用いた図像検索を試行できるコーナー“Search the example collections”が実装されており、ヴィクトリア&アルバート博物館、米・メトロポリタン美術館、台湾の国立故宮博物院の所蔵品画像約2,700点が検索対象となっています。

E2154 - 国立国会図書館,次世代デジタルライブラリーを公開

国立国会図書館(NDL)では,次世代の図書館システムの開発を目指し,調査研究を行っている。これまでの成果の一つとして,2019年3月29日にNDLラボのウェブサイトから「次世代デジタルライブラリー」というウェブサービスを公開した。

国立国会図書館、NDLラボで「次世代デジタルライブラリー」を公開

2019年3月29日、国立国会図書館(NDL)は、NDLラボで「次世代デジタルライブラリー」を公開しました。

NDLの次世代システム開発研究室が開発したデータベースであり、「キーワードで探す」では資料の全文検索が、「絵で探す」では自動で抽出された各資料の画像・図版の中から似たものを探すことが可能である等、実験的な機能を備えています。

検索対象となる資料は、国立国会図書館デジタルコレクションで提供している資料の中から、著作権の保護期間が満了、 かつ、日本十進分類(NDC)6類(産業)に分類される資料の一部(10,550点)であり、今後、資料の追加が予定されています。

なお、動作確認は最新のChrome及びFirefoxで行っており、Internet Explorerでは動作しません。

「次世代デジタルライブラリー」を公開しました(NDLラボ, 2019/3/29)
https://lab.ndl.go.jp/cms/node/78

次世代デジタルライブラリー
https://lab.ndl.go.jp/dl/

奈良文化財研究所都城発掘調査部史料研究室、古代の地名の漢字やよみを検索することができる「古代地名検索システム」を公開

2015年12月11日、奈良文化財研究所都城発掘調査部史料研究室は、「古代地名検索システム」を公開しました。地名を検索すると、その地名が属する国・郡・郷とよみ、地名の異表記などが表示されます。

収録データは、『和名類聚抄』所収の古代地名(国郡郷名)約4200件とのことで、『和名類聚抄郡郷里驛名考證』(池邊彌著、吉川弘文館、1981 年)、『日本歴史地名大系』(平凡社、1979-2004 年)、『古代地名大辞典』(角川書店、1999 年)の研究成果を参照し、立項地名を決定したとのことです。

今後、さらに文献資料と木簡に記載される地名を収集し、研究・検討して収録をすすめる予定とのことです。

古代地名検索システム
http://chimei.nabunken.go.jp/

「古代地名検索システム」公開のお知らせ(奈良文化財研究所都城発掘調査部史料研究室, 2015/12/4付け)
http://repository.nabunken.go.jp/dspace/handle/11177/5311
http://repository.nabunken.go.jp/dspace/bitstream/11177/5311/1/20151204_chimei.pdf

参考:

ページ