検索エンジン

人文学オープンデータ共同利用センター(CODH)、「IIIF Curation Finder」「IIIF Curation Platform」「顔貌コレクション(顔コレ)」を公開

2018年5月23日、人文学オープンデータ共同利用センター(CODH)が、「IIIF Curation Finder」「IIIF Curation Platform」「顔貌コレクション(顔コレ)」を公開しました。

「IIIF Curation Finder」は、「IIIF Curation Viewer」で作成したキュレーションを検索可能にするとともに、検索結果を再編集した新たなキュレーションも公開可能としたものです。

「IIIF Curation Platform」は、IIIFの世界における有力な検索エンジンの不在という課題に対応するために、JSONkeeperやCanvas IndexerなどのソフトウェアをAPIで接続することで、IIIF検索エンジンのプロトタイプとして作成されたものです。

「顔貌コレクション」は、「IIIF Curation Platform」を活用したもので、美術作品に出現する顔の部分を切り取って集め、それを美術史研究(特に様式研究)に活用するプロジェクトです。顔の描き方を比較検討することで、例えば絵師や工房の異同を推定したり、影響関係を見出したりすることが可能になるとしています。

Google社、自然言語処理研究のデモとして、文章を入力すると書籍内の適切な一節を表示する“Talk to Books”を公開

2018年4月13日、Google社が、自然言語処理研究のデモとして、“Talk to Books”を公開しました。

“Talk to Books”は、文章レベルで書籍を検索できるツールで、実装にあたっては、10億もの会話に基づいた機械学習が行われています。

文章や質問を入力すると、キーワードマッチングによる手法ではなく、Google Books内の10万冊を超す書籍の中から意味的に近い一節を見つけ出して表示します。

機械学習に基づいた単語の連想ゲーム“Semantris”等も併せて公開されています。

Introducing Semantic Experiences with Talk to Books and Semantris(Google Research Blog,2018/4/13)
https://research.googleblog.com/2018/04/introducing-semantic-experiences-with.html

オープンソースのデータリポジトリ“Dataverse”、Schema.orgに対応

2017年12月6日、オープンソースのデータリポジトリ“Dataverse”を開発する“Dataverse Project”が“Dataverse 4.8.4”を公開し、“Schema.org”に対応したと発表しています。

2017年夏、同プロジェクトでは、研究データのウェブ上での発見可能性向上や文献管理ツールへのメタデータのエクスポートに対応するために“Dublin Core”を採用しましたが、FORCE11の「学術データリポジトリのデータ引用ロードマップ」での“Dublin Core”“Schema.org”両者の採用という推奨事項に対応するため、今回の実装となりました。

今回、“Dataverse”のいくつかのメタデータ要素を“Schema.org”にマッピングすることを延期しているため、今後のリリースでこれらの要素に対応する計画です。

Dataverse Project
https://dataverse.org/
※「Dataverse 4.8.4 release adds support for Schema.org December 6, 2017」とあります。

“Mendeley Data”、Googleのデータセット用のマークアップ標準を採用

2017年5月23日付けのMendeleyのブログが、研究データリポジトリ“Mendeley Data”が、Googleのデータセットのためのマークアップ標準(markup standard)を採用したと発表しています。

Googleの検索エンジンが認識する構造化された方法で“Mendeley Data”搭載のデータセットについて記述することで、その発見可能性を高め、検索結果から簡単にデータセットを利用できるようにすることを目的としています。

Mendeley Data adopts Google Science Datasets standards(
Mendeley Blog,2017/5/23)
https://blog.mendeley.com/2017/05/23/mendeley-data-adopts-google-science-datasets-standards/

「Googleの著作権侵害対策」のレポート(Google公共政策部の“How Google Fights Piracy”の日本語訳)が公開

2016年9月12日、Google公共政策部は、「Googleの著作権侵害対策」というタイトルのレポートを発表しました。

この報告書は、Googleが2016年7月13日に公開したレポート“How Google Fights Piracy”の日本語訳となっています。

・イントロダクション
・業界の状況とオンラインイノベーション
・数字で見る著作権
・YouTube
・Google のウェブ検索
・Google Play
・広告
・結論

の各章で構成され、Googleによる著作権管理等、著作権侵害に対する取組みのほか、コンテンツを管理することによって、GoogleやYouTubeを活用し、多くの収益がもたらされていることも、事例とともに紹介されています。

「Googleの著作権侵害対策」
https://drive.google.com/file/d/0B_gwgQKfOXicZ0lWcl83LURNY2c/view

Google の著作権侵害対策 日本語版リリース(Google Japan Blog)
https://japan.googleblog.com/2016/09/google.html

Elsevier社が研究データの検索ツール”DataSearch”ベータ版を公開

Elsevier社が新たに研究データの検索ツール、”DataSearch”のベータ版を公開しています。

同ツールは複数のデータリポジトリ等に収録された研究データを横断して検索できるシステムです。公開された生データ等を検索できるほか、論文中に含まれる図表等についても該当部分のみを抜き出して、検索結果画面上で閲覧することができます。また、データの種類や公開元リポジトリ、日付による検索結果の絞り込みが実装されています。

DataSearchは現在も開発継続中のツールであり、システム改善に向けて利用者からの意見等も受け付けているとのことです。

Introducing Elsevier DataSearch(Mendeley Blog、2016/8/24付け)
https://blog.mendeley.com/2016/08/24/introducing-elsevier-datasearch/

「あのひと検索SPYSEE2」公開

2016年8月17日、株式会社オーマが、ウェブ上の情報から人物間のつながり等を可視化する検索エンジン、「あのひと検索SPYSEE2」を公開しました。2008年に公開された「あのひと検索SPYSEE」の新バージョンです。

同サービスでは著名人の氏名等で検索すると、その人物と関係する人物の相関図や、プロフィール、関連キーワード等を閲覧することができます。インターネット上での共起関係に基づく独自アルゴリズムに、機械学習・人工知能技術を加えて、人物同士のつながりの強さや人物とキーワードのつながりの強さを算出しているとのことです。

あのひと検索SPYSEE2
http://spysee2.jp/

有名人の人間関係が丸分かり!? AI搭載の人物検索「あのひと検索SPYSEE2」公開(ITmediaニュース、2016/8/17付け)
http://www.itmedia.co.jp/news/articles/1608/17/news065.html

OCLC、書籍検索サイトの“Novelry”と提携

OCLCが、2013年12月20日、新たな“WorldCat.org traffic partners”の1つとして、米国で新しく立ち上がった書籍検索サイトの「Novelry」と提携したことを発表しています。米国内の利用者は、Novelryの検索結果から“Find a Copy”の“Borrow”ボタンをクリックすると、WorldCatを経由して地域の図書館の所蔵状況が確認できるようになっているとのことです。

なお、Novelryは、同サイトの説明によると、近年の他者の購入データなどに基づくリコメンド機能の考え方とは一線を画した検索サイトを目指しているようです。ユーザが検索履歴のどの段階にも遡りやすくなっている等の特徴があるようです。

OCLC partnership with Novelry helps connect readers with libraries(OCLC, 2013/12/20付け)
http://www.oclc.org/en-US/news/announcements/2013/partnership-with-Novelry-connects-readers-with-libraries.html

WorldCat.org traffic partner sites

Google検索の新技術「ナレッジグラフ」が日本でも提供開始

2012年5月にGoogleが発表した新技術「ナレッジグラフ」は、これまで英語版のGoogle検索のみに対して提供されていましたが、12月5日に、日本語を含む7か国版でも提供開始されることが発表されました。

ナレッジグラフは、“もの”とそれらの間の“つながり”から成るデータベースをもとに、ユーザに対して検索キーワードと関連する情報を提示するというものです。同機能によって、例えば「ルーヴル美術館」というキーワードで検索すると、検索結果画面の右側に、同館の開館情報や所蔵コレクションのサムネイル写真が表示されるようになるなどと説明されています。

ナレッジグラフ "モノ" を認識する検索エンジンに向けて(Google Japan Blog 2012/12/5付け記事)
http://googlejapan.blogspot.jp/2012/12/blog-post.html

Google、検索ワードの関連情報を表示する「ナレッジグラフ」を日本でも開始(INTERNET Watch 2012/12/6付け記事)
http://internet.watch.impress.co.jp/docs/news/20121205_577442.html

参考:
Google検索が新技術「ナレッジグラフ」でアップデート、セマンティック検索に向けた大きな一歩を踏み出す

Bing、検索結果にブリタニカオンラインのコンテンツを表示開始

検索エンジンBingが、エンサイクロペディア・ブリタニカと提携し、ブリタニカオンラインのコンテンツをBingの検索結果にダイレクトに表示するサービスを開始したとのことです。

Ref.
Bing introduces New Britannica Online Encyclopedia Answers(The Bing Team 2012/6/7)
http://www.bing.com/community/site_blogs/b/search/archive/2012/06/07/bing-introduces-new-britannica-online-encyclopedia-answers.aspx

Bing
http://www.bing.com/
英語環境のみのようであり、設定を米国等の英語圏にすると確認することができます。

ページ