Wikidata:データ提供

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Data donation and the translation is 100% complete.
データ提供
このページはウィキデータへのデータ提供に関心を持たれた団体、会社、機関ならびに個人を対象に書かれたものです。

関連する資料へのリンク:

ウィキデータについて

ウィキデータへのデータ提供について(英語)
リンクトデータ - サンフランシスコ

ウィキデータは、世界についての多言語のフリーな知識ベースで、人間も機械も同様に読んだり編集したりできます。マルチメディアファイルを扱うウィキメディア・コモンズに似て、ウィキメディア・プロジェクトの全ての言語版のデータへの中央集約的アクセスを提供しており、他の多くの外部ウェブサイトからも使用されています。ウィキデータのデータは、ウィキペディアを含む他のウィキメディア・プロジェクトと同様に、ボランティアのコミュニティによって、手動またはソフトウェアを使用して追加されています。

ウィキデータには何千万もの項目があり、それぞれが人物、場所、芸術作品、抽象概念、その他の種類の実体を表しています。各項目は文(キーと値のペア)を持ち、各文は「生年月日」などのプロパティと、その項目に適した値で構成されています。プロパティはウィキデータ上に独自のページを持ち、項目と接続し、結果としてリンクトデータ構造となっています。また、VIAF IDのような外部識別子についての文も可能です。

ウィキデータは、フリーで多言語の教育的なコンテンツの成長と発展を推進しウィキ形式のプロジェクトの全コンテンツを無料で一般に提供することを目的とする非営利の慈善団体、ウィキメディア財団によって運営されています。

ホスティングするデータについて

ウィキデータは、世界についての基礎レベルの情報に焦点を絞っており、その主題に関する専門的なデータについては他のリソースへとリンクしています。ウィキデータ上のデータの情報源は、次の条件を満たさなければなりません。

  • 信頼できること
  • 一般に公開されていること

ご所管のデータのどの部分がウィキデータに適しているかを知るには、ウィキデータ・コミュニティと相談するのがよいでしょう。

ウィキデータにデータを提供する意義

ウィキデータにデータを追加する理由はいくつかありますが、たとえば次のようなものがあります。

ご所管の情報をより多くの人が目にする手助けとなる

ウィキデータからのデータは、月間150億ページビューを超える世界で最も利用されているサイトの1つであるウィキペディアをはじめとして、多くの高トラフィックサイトで使用されています。

オープンな知識を改善

ウィキデータはウィキメディア・プロジェクトや外部サイトで利用できるデータをホストしています。ウィキデータにデータを追加することで、多言語のウィキメディア・プロジェクトすべてでご所管のトピックが十分にカバーされ、内容を最新に保つための枠組みやチェックリストが作成されます。

ご所管のウェブサイトへのアクセスを増加させる

ウィキデータや、ウィキペディアを含むウィキデータを利用しているサイトを見ている人は、データの出所を示すリンクから、ご所管のウェブサイトに簡単にアクセスできます。

提供者と利用者双方がもっと活用できるデータに

ティム・バーナーズ=リー(Webの発明者)の提案する5つ星スキームでは、データをスプレッドシートとして公開することは2つ星の評価ですが、ウィキデータに提供するとネットワーク効果の恩恵を受けることで、5つ星の評価になります。ウィキデータにデータを提供することで以下のことが可能になります。

  • 他のデータとの組み合わせ
  • ウィキデータツールを使ってデータを探索
  • 他のソースからのデータと共に、データを可視化


ウィキデータと活動実績のある機関

導入事例

多くの機関がウィキデータとの連携を選択しています。以下に代表的なものを紹介します。

データをウィキデータに提供した機関

これまでウィキデータは、多くの機関からデータの提供を受けました。例として下記をあげます。

  • Art UK(旧称BBC: Your Paintings
  • フランス国立図書館: 文献ID番号、参考文献情報ならびに人物情報データ
  • 大英博物館: Thesaurus (百科全書)
  • オーストラリア国立図書館: People identifier (人物情報)
  • オランダ美術史研究所: 美術家人物情報
  • UNESCO: 登録プログラム 例: ユネスコ世界遺産
  • National Nuclear Data Center: 核種の安定性、自然存在量、崩壊と半減期

ウィキデータと著作権

オープンデータとデータライセンスの概要は、Wikidata:Open data publishing(オープンデータの公開)をご覧ください。

ウィキデータのすべてのデータは、クリエイティブコモンズ CC0(パブリックドメイン)で公開されています。しかしながら、個々の事実や、IDなどの識別子は著作権の保護の対象となりません。あなたの組織がヨーロッパに拠点を置いている場合は、IDリスト全体がデータベースの著作権で保護されている可能性がありますが、私たちはリスト全体を一括してコピーすることはせず、ボランティアが個別に1つずつ追加しています。 詳しくはウィキメディア財団のデータベース権についてのガイドラインをご覧ください。

データベースはそれぞれ異なります。あなたの組織がデータのライセンスを変更する必要があるかどうか、あるいは利用可能にしようとしているデータの集まりに著作権が生じるかどうか、などを確認するにはウィキデータのコミュニティにご連絡ください。

データの再利用・組み合わせ

ウィキデータにはデータを操作するための多くのツールがあります。完全な一覧はウィキデータの外部ツールおよびツールディレクトリをご覧ください。

データの再利用

ウィキデータのデータへのアクセスは簡単です。データはウィキメディア・プロジェクトをはじめ、それ以外の場所でも利用でき、わくわくするようなアプリが作成可能になります。

翻訳された名前、誕生日/死亡日、位置情報、フリー画像など、私たちのデータを自由に使うことができます。

自分のデータと他のデータセットとのマッチング

他のソースからのデータで、ご所管のデータを補強したり、クロスチェックするための多くのツールが存在します。たとえば、BEACONは項目を比較して、他のデータと照合したIDの一覧を表示します(例:Art UKの美術家とVIAFデータの照合など)。また、Mix'n'matchOpenRefineは、ご所管のデータベースとウィキデータとの接続に使用することができます。

視覚化

ウィキデータのデータを視覚化するツールには次のようなものがあります。

  • Histropedia: ウィキペディアやウィキデータのデータを利用して、出来事がウィキペディアの記事とリンクしているインタラクティブな年表を自動生成します。例:「アポロ計画
  • Monumental:ウィキデータ、ウィキペディア、ウィキメディア・コモンズの情報を照合して、各種遺産を探索したり、モニュメントについて詳しく知ることができるツールです。例:「パリ
  • Wikidata Graph Builder: ウィキデータのデータを使って、概念とその関連概念を図表化します。
  • ウィキデータ・クエリ・サービス: ウィキデータの項目に対して複雑なクエリを実行することができます。例:「世界遺産


ウィキデータへのデータ追加方法

ウィキデータにデータを追加するプロセスには技術的に困難な場合もありますが、ウィキデータのコミュニティは最善の方法について皆さんと話し合い、必要に応じて支援を提供します。基本的なプロセスは次の通りです。

  1. ご所管のデータの内容と、ウィキデータに入れたい旨をご連絡ください。
  2. インポートに適したデータを決定するため、ウィキデータのコミュニティとご相談ください。
  3. ウィキデータのコミュニティと協力して、データのインポート作業を行います。
  4. データを最新の状態に維持してください。または他の人が代わりにそれを行えるように、必要なリソースを共有してください。

1. ウィキデータ・コミュニティに連絡する

ウィキデータ・コミュニティとの連絡には「Project chat」(日本語の場合は井戸端)と呼ばれる掲示板を使用してください。

  1. ご自分のウィキメディア・アカウントを作成 (アカウント名に組織名を使わないでください)。
  2. ログインしていることを確認します。
  3. Project chatのページに移動。(日本語表示にするには、ページ名の下にあるボックスから「日本語」を選んでください。)
  4. 新たな話題を追加 ボタンをクリック。
  5. メッセージを記入します。タイトルに用件を記入したか確認してください。
  6. メッセージの最後に ~~~~ と入力して署名 (半角のチルダ4個)します。
  7. メッセージの下のプレビューボタンをクリック、メッセージが正しく書けているか確認します。 ~~~~ を追加したところにアカウント名が表示されます。
  8. 変更を公開ボタンをクリックしてメッセージを投稿します。

ウィキデータ利用者からの返答は、投稿された「Project chat」(井戸端)、もしくはご自分の「利用者ページ」に寄せられます。画面右上のアカウント名の横にトークというリンクがありますので、クリックしてください。掲示板は何日かたったメッセージは過去ログに移動されます。掲示板の過去のメッセージにアクセスするには、過去ログのページを参照してください。

IRCまたは Telegramの利用もできます。

2. インポートすべきデータをウィキデータ・コミュニティと一緒に決める

ウィキデータにはデータを何でも入れるのではなく、有用なサブセットのみインポートします。最低限の必要事項として、ウィキメディア財団の情報価値の方針をご覧ください。

3. ウィキデータ・コミュニティと共にデータのインポート作業を行う

ウィキデータにデータを追加する方法は以下のようにいくつかあります。

手動でのデータ入力

誰でも手動でウィキデータにデータを追加できます。

オンラインのツール

ウィキデータへのインポートを手助けするオンラインのツールは多数あります。データインポートのための特定の作業を支援するツールを以下にいくつか紹介します。

  • Mix'n'match には信頼できる情報源の重要な概念のリストがあり、ワンクリックでウィキデータの項目と名前を照合します。ご所管のリストを対象に含めることが可能です。Mix'n'match を支える動機に関するブログ投稿 (英文) をご参照ください。
  • Primary sources tool(プライマリ・ソースツール)はウィキデータに対するデータ提供において、コミュニティに提供されたデータのキュレーションを行う編集者が査読、編集あるいは拒否するワークフローを可能にします。当初はFreebaseのデータセット向けに開発されたものですが、キュレーションを受けていない非常に大きなデータセットにも使用することができます。
  • QuickStatements (クイック・ステートメント) は、スプレッドシートからタブ区切り形式でコマンドを入力することができるツールで、項目の新規作成や文の追加が可能です。


ウィキデータのAPI

ウィキデータAPIは、ウィキの機能、データ、メタデータへの便利なアクセスをHTTPで提供するウェブサービスです。

ボット

ボット (ロボットとも呼ぶ) とは人間による判断を必要としない編集を行うツールです。ボットは言語間リンク、ラベル、説明、文、情報源等を追加したり、項目を新規作成したりします。ボットでのデータインポートについて、コード作成のヒントや発想もご覧ください。


4. データを最新の状態に保つ

ウィキデータは何十年にわたって世界中の人々や機械とデータを共有することを目指しています。データによっては時代と関係ないように見えるものもありますが、インポートしたデータにはある時点で有効性や完全性が失われる可能性のあるものも含まれています。データはメンテナンスされないと、その価値を失うだけでなく、誤った情報になってしまうこともあります

簡単に繰り返すことができるインポートの場合を除いて、

  • ウィキデータ・コミュニティが、データソースとウィキデータとを容易に同期できるように、文書、スクリプト、その他の技術的リソースをフリーライセンスで提供してください。
  • または自身で責任を持ってデータをメンテナンスしてください。

データを維持するモチベーションを高めるには、データを活用することも1つの方法です。ウィキデータの可能性をぜひ活用してください。

組織がウィキデータに関与できるその他の方法

組織がウィキメディアに関与するその他の方法としては、以下をはじめ多数あります。

  • メディアのコンテンツを利用可能にする
  • ウィキペディアの記事作成に貢献
  • ウィキメディアイベントの主催
  • ウィキメディアン・イン・レジデンス (Wikimedian in Residence)の受け入れ

詳細はあなたの地域のウィキメディア国別・地域別協会にご連絡ください。

お役立ちリンク

ウィキデータの紹介
コミュニティ・ポータル
ウィキデータ用語集
ウィキデータのツール・ディレクトリ
ウィキメディアのアカウントを作成(利用者名に組織名を入れないでください)