オープンデータ

英国物理学会出版局(IOP Publishing)、抄録データのオープン化を推進するイニシアティブI4OAに参加

2021年10月21日、英国物理学会出版局(IOP Publishing)は、抄録データ(abstracts)のオープン化を推進するイニシアティブであるInitiative for Open Abstracts(I4OA)に参加したことを発表しました。

IOP Publishingは、全ての抄録データを論文の基本メタデータに含め、オープン化する意向を示しています。なお、抄録データの登録先はCrossrefとなっています。

IOP Publishing makes abstracts openly available(IOP Publishing, 2021/10/21)
https://ioppublishing.org/news/iop-publishing-makes-abstracts-openly-available/

【イベント】シンポジウム「データサイエンスへの期待2021」(12/8・大阪)

2021年12月8日、大阪成蹊大学が、データサイエンス学部開設に先駆け、シンポジウム「データサイエンスへの期待2021」を、大阪市の同大学図書館棟7階ホールで開催します。

大学進学の選択肢として高校生の関心が増している「データサイエンス」への理解を深めることを目的としており、高等教育等の教育関係者が対象です。

参加費は無料であり、事前の申し込みが必要です。

当日のプログラムは以下の通りです。

司会進行:中村佳正氏(大阪成蹊大学副学長、データサイエンス学部設置準備室長、京都大学名誉教授)

・セッション1:データサイエンスのための情報教育「社会とデータサイエンス教育」
講演者:吉川正俊氏(京都大学情報学研究科・教授)
討論者:鎌原淳三氏(神戸大学海事科学研究科・准教授)

・セッション2:データサイエンスのための高校数学と統計学「データサイエンスのための統計学」
講演者:上阪彩香氏(大阪大学数理・データ科学教育研究センター・特任助教)
討論者:狩野裕氏(大阪大学基礎工学研究科・教授)

Internet Archive、学術論文のためのデータベースInternet Archive Scholarの引用索引“Refcat”を公開

2021年10月19日、Internet Archive(IA)が、学術論文のためのデータベースInternet Archive Scholar(IA Scholar)の引用索引“Refcat”の公開を発表しました。

発表によると、今回公開された“Refcat”データセットには、IA Scholarに蓄積されている6,000万件以上のメタデータおよび1億2,000万以上の学術的成果物から抽出された、13億件以上の引用情報が含まれています。データセットはクリエイティブ・コモンズ・ライセンスのCC0により提供されています。

また、データの抽出や照合のために作成されたツールもオープンソースで提供されており、プロジェクトの技術的な詳細をまとめたホワイトペーパーがプレプリントサーバarXivで公開されているとあります。

メディア芸術作品に関するデータを活用するためのウェブサイト“MADB Lab”が公開

2021年10月13日、メディア芸術作品に関するデータをより広く活用するためのウェブサイト“MADB Lab”(メディア芸術データベース・ラボ)の公開が発表されました。

文化庁の「メディア芸術データベース」で公開されているデータを対象としたデータセットや、SPARQLエンドポイント、データ利活用事例等が提供されています。

MADB Labがオープンしました(MADB Lab, 2021/10/13)
https://mediag.bunka.go.jp/madb_lab/news/350/

MADB Lab(メディア芸術データベース・ラボ)について(MADB Lab)
https://mediag.bunka.go.jp/madb_lab/about/

【イベント】オンラインセミナー「オープンサイエンス時代におけるデータアーカイブの役割とデータ活用2「第4次団体に関する調査(圧力団体調査)」を事例に」(11/2・オンライン)

2021年11月2日、東京大学社会科学研究所附属社会調査・データアーカイブ研究センターが、「オープンサイエンス時代におけるデータアーカイブの役割とデータ活用2「第4次団体に関する調査(圧力団体調査)」を事例に」をオンラインで開催します。

オープンサイエンス時代において、社会調査の個票データを公共的な研究資源とする重要性が高まっている中で、公開されたデータへの理解を深めることや、個票データをデータアーカイブに寄託することの利点や可能性を考えることを目的としています。

2020年度に第1回が開催されており、2回目の開催にあたる今回は筑波大学の山本英弘氏、東京大学の三輪哲氏による講演が行われます。

参加費は無料ですが、申し込みが必要です。

設立1周年を迎えたI4OAの現況(記事紹介)

2021年10月6日、セマンティックウェブ技術の活用によるオープンな書誌データ・引用データ公開を通してオープンスカラシップの推進に取り組む非営利団体OpenCitationsは、同団体も設立に携わったInitiative for Open Abstracts(I4OA)が2020年9月24日の設立から1周年を迎えることを記念し、その現況を紹介する記事を公開しています。

I4OAは、抄録データ(abstract)のオープン化を推進するイニシアティブです。全ての学術出版社に対し出版物の抄録データをオープン化するよう呼び掛けており、可能であればデータをCrossrefに提出する形式での実現を求めています。

設立時点でI4OAへの支持を表明していた出版社は40社でしたが、現在は86社となり2倍以上に増加しています。一方で、その中に出版数が多い4社(Elsevier、Springer Nature、Wiley、Taylor & Francis)は含まれていません。その背景事情として、記事では次のような点を推測として示しています。

総務省、データサイエンス・オンライン講座「社会人のためのデータサイエンス演習」を開講

2020年9月29日、総務省が、大規模公開オンライン講座(MOOC)のプラットフォーム「gacco」において、データサイエンス・オンライン講座「社会人のためのデータサイエンス演習」を開講しました。

同講座は、2020年9月に実施した講座を再び開講するものであり、業務やビジネス上の分析事例を中心に、実践的なデータ分析手法を学習することができます。

登録料および受講料は無料であり、誰でも受講登録が可能です。

データサイエンス・オンライン講座「社会人のためのデータサイエンス演習」の開講(総務省, 2021/9/28)
https://www.soumu.go.jp/menu_news/s-news/01toukei09_01000065.html

データサイエンス・オンライン講座「社会人のためのデータサイエンス演習」(gacco)
https://gacco.org/stat-japan2/

フランスの高等教育・研究・イノベーション省(MESRI)、データ・アルゴリズム・ソースコードの戦略に関する2021年から2024年のロードマップを発表

2021年9月24日、フランスの高等教育・研究・イノベーション省(MESRI)が、データ、アルゴリズム、ソースコードの戦略に関する2021年から2024年のロードマップを発表しました。

データやアルゴリズム、ソースコードの公開・共有・活用のための4か年計画であり、「イノベーション」「信頼性」「簡素化」の3つに関する戦略と以下の5つの目標が示されています。

・データの公開・利活用サービスの推進、開発、相互化
・フランスおよび欧州の技術的な主権・独立に貢献する
・データに関する文化や使用法の発展
・データ、アルゴリズム、コードを全ての人の共通財産とする
・高等教育、研究、イノベーションのデータの国際的な可視性を向上する

NDLラボ、振り仮名のデータセット「振り仮名注釈コーパス」(2種類)を公開

2021年9月21日、国立国会図書館(NDL)のNDLラボが、振り仮名のデータセット「振り仮名注釈コーパス」2種類をGitHubで公開しました。

日本語のテキストを分かち書きにした上で、分割した箇所に振り仮名を付与したもので、青空文庫の公開作品のテキストデータに対し、視覚障害者情報総合ネットワーク「サピエ」が視覚障害者に提供している点字データに由来する振り仮名を付与して作成したものと、国立国会図書館が提供する書誌データを元に作成したものの2種類を公開したものです。

振り仮名注釈コーパスの公開について(NDLラボ, 2021/9/21)
https://lab.ndl.go.jp/news/2021/2021-09-21/

青空文庫及びサピエの点字データから作成した振り仮名のデータセット(GitHub)
https://github.com/ndl-lab/huriganacorpus-aozora

ページ