Shortcuts: WD:LOD, w.wiki/87CA

Wikidata:リンクト・オープン・データ(LOD)化のワークフロー

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Linked open data workflow and the translation is 58% complete.

ウィキメディアのプロジェクト群にデータやメディアその他の資産を投稿する際には、よく考えなければならないことがいろいろあります。以下の図に抽出したツールやスクリプトはリンク付きデータのワークフローに用いられ、GLAM機関には特に重宝されるものです。原図にはアウトリーチ・ウィキ上の データ及びメディアのパートナー関係図を使いました。

PREPARE and normalize source data and media RECONCILE with Wikimedia modeling and coverage INGEST data, media, and free content ANALYZE, correct, and enrich RE-USE content intra-wiki and externally REPORT and measure impact
Notes

Try finding a similar project or collection set on Wikidata or Commons to see how it has been done in the past.


質問はウィキデータのメインプロジェクト・チャットやコモンズの井戸端で尋ねてください。


寄付しようとしているコンテンツがフリーなライセンスでリリースされているかまたは著作権が期限切れであることを確認してください。コモンズ向けに画像を準備する簡単な方法はFlickrにコレクションをアップロードして画像に適切なライセンス (CC0, CC-BY, CC-BY-SA)を設定することです。非商用(NC)ライセンスは使用しないでください。

ウィキデータはCC0ライセンスを使用しています: 投稿データは全てCC0またはパブリックドメインとして献呈されなければなりません。

メモ

For Wikidata, usually a "crosswalk database" is needed to map terms from the uploading data set (a CSV file or records from an API) to Wikidata terms. This can be achieved with OpenRefine, a custom mapping using Google Spreadsheets, or both.


ウィキデータにはどのようなエンティティやプロパティが存在していて、コモンズではどのようなカテゴリやテンプレートが使われているかをチェックします。

新しい項目に適切な"分類" (P31) 及び"上位クラス" (P279) プロパティをセットするために、その項目がウィキデータでどのようにモデル化されているかを調べます。

ケーススタディをここに追加してください。

メモ

Try uploading small test batches before doing large data sets.

ウィキデータやコモンズにコレクションのメタデータやメディアファイルを取り込む際には、それらが相互に関連付けられているかどうか確認する方法が必要です。オブジェクトに対しては 所蔵番号(P217)にコレクション(P195)の修飾子と組織をつけたものがよく使われます。コモンズでのファイル名のベストプラクティスは組織/情報源、所蔵番号及び可能なら説明的なタイトルなどが組み合わされたものです。


ウィキデータ項目の説明にP217を付けると、よく似た項目名を区別するのに役立ちます(例. 無題、または 花のある静物)

ケーススタディをここに追加してください。

メモ

Depending on the success of the import and uploading process, you may need to deal with duplicates or conflicts with other editors.


コモンズ向けには、あなたはファイルを移動したりカテゴリを追加したりしなければならないかもしれません。


あなたは投稿したコンテンツを逐次追跡したり、初期の投稿後にプロパティやメタデータを追加し続けたりするために、特別なカスタム・メンテナンス用のクエリーを作成したいかもしれません。

メモ

Scripts and templates can generate on-wiki content such as tables and infoboxes from Wikidata.


識別子/典拠管理レコードをインポートすると、ウィキデータはクロスウォーク・データベースとして機能し、多種多様な大量のデータベース同士のマッピングを探索することができます。

注記

Show the impact of contributions by tracking metrics on files used or impressions over time. For partnerships, this can help validate the work being done or to encourage more collaboration.


オンでマンド(GLAMorgan)のツールやGLAM組織のコモンズ・カテゴリにより定期的にレポートするものがあります。


あなたはウィキデータ・クエリーを使って網羅率や利用状況のカスタムレポートを作成したいかもしれません。

ツールとスクリプト

PDFファイルを構造化データに変換します。あなたの情報源があまりよく整形されていない場合は、[<tvar name=1">https://tabula.technology/</tvar> Tabula] のようなスクレイピング・ツールを試してみてください。

Tools and scripts

OpenRefine 研修動画はGLAMウィキ2018カンファレンスより。Sandra Fauconnier

Tools and scripts


Pattypan は各ファイル用に必要なメタデータを集めるためにスプレッドシートを使ってメディアを一括アップロードするのにいちばんよく使われています。芸術作品、写真、その他メディア用のテンプレートを見つけて、ファイルをオーガナイズするための適切なカテゴリを識別してください。


Quickstatements はスプレッドシートから生成されたCSVの命令でウィキデータの文を作成します。


Mediawiki API はより高度な作業を行う場合に Python (PyWikibot または PAWS)によるプログラミング環境を提供しています。

ツールとスクリプト

プロパティ完成度の追跡:

Wikidata:WikiProject sum of all paintings/Property statistics - User:Multichill Githubにあるスクリプト

InteGraality - User:Jean-Frédéric ウィキデータの特定の部分に対するプロパティの網羅率のカスタム・ダッシュボードを生成するスクリプト。

Metropolitan Museum of Art向けのプロパティのダッシュボード

ウィキメディア・コモンズの Data Roundtripping プロジェクトとレポート

ツールとスクリプト

Infoboxのチュートリアル:

Wikidata:Infobox_Tutorial - ウィキデータと連携したウィキメディア及ぼその他プロジェクト向けの、ウィキデータを元にした情報ボックスやその他テンプレートの作成方法

コモンズのカテゴリ上のウィキデータ駆動の情報ボックス:

Template:Wikidata Infobox - 作者者 User:Mike Peel

ツールとスクリプト

メトロポリタン美術館のウィキデータへのオープンアクセス貢献に関する統計を表示するウィキデータのクエリー:

PAWS ノートブック、登壇者 User:Fuzheado

ケーススタディ

  • Add yours here