Help:データ型

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Help:Data type and the translation is 100% complete.

データ型は、文の振る舞いや受け付けるデータの種類を定義するものです。違った種類の文には違った種類のプロパティを使用するように、データ型も違ったものを使用します。データ型の設定はプロパティの新規作成時に行われ、一度設定されるとプロパティはそのデータ型に固定されます。データ型はプロパティの使われ方に影響してくるので、有益なプロパティを定義するためにも、一定の計画性をもって決定されるべきです。

プロパティに関する調整は、Wikidata:Property proposalで行われています。

Built-in data types
Data typeNumber of
properties
External identifier9,168
Item1,670
Quantity661
String335
URL109
Commons media file84
Point in time67
Monolingual text62
Property21
Geographic coordinates10
Tabular data6
Geographic shape3
Extra data types
Data typeNumber of
properties
Mathematical expression36
Sense19
Lexeme15
Form10
Musical Notation6

データ型別のプロパティ

現在データ型を要求するプロパティの一覧はこちらを参照:

エンティティにリンクするデータ型

ウィキデータには6つのエンティティの型(ItemPropertyLexemeSenseFormおよび⧼datatypes-type-wikibase-EntitySchema⧽)があります。各エンティティ型に対して、同名のデータ型が存在し、その型のエンティティにリンクするために使うことができます。

Item
項目へのリンク。 (list of properties)
Property
プロパティへのリンク。 (list of properties)
EntitySchema
エンティティスキーマへのリンク。 (list of properties)

以下のデータ型はウィキデータの語彙素データを構成する語彙素に対して第一に適用されます。

Lexeme
語彙素へのリンク。 (list of properties)
Form
関係を示すために他の語彙素で語形を参照するための語彙素の文。 (list of properties)
Sense
他の語彙素の語義を参照するための語彙素の文。 (list of properties)

文字列に基づくデータ型

String

type: string (String)
list of properties: カテゴリ:文字列-データ型を持つプロパティ -- Special:ListProperties/string

他言語や他の数フォーマットに翻訳する必要のない文字、数、記号の列。文字列は計算に計算には使用されない。

Examples:
  • B123
  • 90928390-XLE
  • u29238

ウィキデータにおける最大の長さは、InitialiseSettings.phpにおいてwmgWikibaseStringLimitsで定義されているように、1,500文字です。

Monolingual text

type: monolingualtext (Monolingual text)
list of properties: カテゴリ:単一言語テキスト-データ型を持つプロパティ -- Special:ListProperties/monolingualtext

他の言語に翻訳しない文字列です。この型の文字列は全言語で再利用されます。よくある使い方としては、地理的なエンティティの現地での表記名、何らかの識別子、化学式、科学分野のラテン語名などです。単一言語テキストで使用できる言語コード、および言語コードの追加は、Help:Monolingual text languagesを参照してください。(注:単一言語テキストは、単一の表記体系としての使用も想定しています。)

ウィキデータにおける最大の長さは、InitialiseSettings.phpにおいてwmgWikibaseStringLimitsで定義されているように、1,500文字です。

External identifier

type: external-id (External identifier)
list of properties: カテゴリ:外部識別子-データ型を持つプロパティ -- Special:ListProperties/external-id

外部システムで使用される識別子を表す文字列。formatter URL (P1630)が定義されている場合、外部リンクとして表示されます。外部識別子参照。

ウィキデータにおける最大の長さは、InitialiseSettings.phpにおいてwmgWikibaseStringLimitsで定義されているように、1,500文字です。

URL

type: url (URL)
list of properties: カテゴリ:URL-データ型を持つプロパティ -- Special:ListProperties/url

一般化した「URL」は、ある種の外部リソースを識別し、ある種の外部サイトへのリンクもしくはある種の特殊なリソースの検索に使用される識別子。

ウィキデータにおける最大の長さは、InitialiseSettings.phpにおいてwmgWikibaseStringLimitsで定義されているように、1,500文字です。

コモンズのファイルを参照するデータ型

Commons media

type: commonsMedia (Commons media file)
list of properties: カテゴリ:コモンズメディア-データ型を持つプロパティ -- Special:ListProperties/commonsMedia

ウィキメディア・コモンズにあるファイルへの参照。テキストフィールドへの入力中、コモンズの「File」名前空間からマッチする項目を検索します。これらのファイルはウィキデータ上の概念を説明するためのものとしても、ウィキペディアに含めるための実際のプロパティの値としても使えます。

Examples:
  • Wikidata-logo.svg

Geographic shape

type: geo-shape (Geographic shape)
list of properties: カテゴリ:地理形状-データ型を持つプロパティ -- Special:ListProperties/geo-shape

ウィキメディア コモンズの地図データファイルを参照します。文字列欄への入力時にコモンズの「Data」名前空間を対象に、適合するエントリを検索します。

Tabular data

type: tabular-data (Tabular data)
list of properties: カテゴリ:表-データ-データ型を持つプロパティ -- Special:ListProperties/tabular-data

ウィキメディア コモンズの表データファイルを参照します。文字列欄への入力時にコモンズの「Data」名前空間を対象に、適合するエントリを検索します。

特定の記法に対するデータ型

Mathematical expression

type: math (Mathematical expression)
list of properties: カテゴリ:数式-データ型を持つプロパティ -- Special:ListProperties/math

数式として表示されるフォーマット文字列

例:

\sqrt{1-e^2} は以下を生成します:

適用できる形式の詳細はHelp:数式の表示をご参照ください。

現状の制限:入力テキストはクエリサービスでクエリすることができません。

Musical Notation

type: musical-notation (Musical Notation)
list of properties: カテゴリ:楽譜-データ型を持つプロパティ -- Special:ListProperties/musical-notation

.png 形式で画像を生成すると楽譜が表示されます。そのデータ型の値は、LilyPond構文に従って音楽を表現する文字列です。

例:

値の文字列 \relative c' { c d e f | g2 g | a4 a a a | g1 |}から次を生成
\relative c' { c d e f | g2 g | a4 a a a | g1 |}

その他のデータ型

Quantity

type: quantity (Quantity)
list of properties: カテゴリ:数量-データ型を持つプロパティ -- Special:ListProperties/quantity

10進数で表される数量。この数の不確実性の範囲と測定単位についての情報を伴う。属性は以下の通り:

  • amount: 数量の主たる値
  • lowerBound: 数量の下限(任意)
  • upperBound: 数量の上限(任意)
  • unit: 項目の測量に用いた単位(空の場合は無次元量)

内部的には、数量、上限および下限は文字列です。正の数はプラス記号を伴って保存されていますが、これは表示されません。数量の表現は127文字より長くすることはできず、したがって数量の最大値は10^126-1です。

単位の変換はconversion to SI unit (P2370)に基づいて実装されています。このプロパティを持つほとんどの単位は、クエリサービスに対するRDFエクスポートで規格化されます(2019年10月現在)。

規格化の表はWMF Mediawiki repositoryでJSON形式で参照できます。

Examples:
  • 762 (無次元)
  • 2500 km (上限・下限なし、単位あり)
  • 1.03 ± 0.02 g (基準値+/-許容差として上限・下限を表し、単位あり)。例えばlisteria botによって作成されるウィキデータの一覧のように、ウィキデータでは許容差が表示されず、基準値のみが表示される場合があります。

Time

type: time (Point in time)
list of properties: カテゴリ:時間-データ型を持つプロパティ -- Special:ListProperties/time

グレゴリオ暦またはユリウス歴の日付。構造の詳細参照。

Examples:
  • 2012
  • 1780-05 (=1780年5月)
  • 1833-11-01 (=1833年11月1日)

より詳しくはHelp:Datesを参照してください。

Globe coordinate

type: globe-coordinate (Geographic coordinates)
list of properties: カテゴリ:天体-位置座標-データ型を持つプロパティ -- Special:ListProperties/globe-coordinate

ある「globe」(あらゆる天体) における緯度と経度の組み合わせで得られる地理的位置(度分秒または10進度数で表現)。デフォルトの天体(globe)は「地球」(globe: http://www.wikidata.org/entity/Q2)です。「精度」(precision) パラメータは、座標のソースの解像度を示します。座標系は「WGS84」(World Geodetic System 1984 (Q11902211)) と想定されることに留意してください。これは地球に似ていない天体には適さない可能性がありますが、変更できません。

現在、ウィキデータのウェブ UI ではこのデータ型のすべてのパラメータは見えるようになりません。値は座標としてのみ表示され、もし天体(globe) がEarth (Q2)であれば埋め込まれた地図も表示します。編集モードで精度を調整できます。天体(globe)は項目表示では見ることも編集することもできません。しかしながら、変更履歴表示では完全な設定を見ることができます()。

ウェブ UI を使用したとき、保存される値は選んだ精度の倍数になります。

APIを使うと全てのデータを編集することが可能です。CLI ツールを介するのも API を操作する方法のひとつです。この例ではOlympus Mons (Q520)は(coordinate location (P625)で使用されている) 天体(globe)パラメータを用いてMars (Q111)における座標を与えられています:

wd ac Q520 P625 '{ "latitude": 18.4, "longitude": 226, "precision": 0.016666666666667, "globe": "http://www.wikidata.org/entity/Q111" }'

globe.js スクリプトは、coordinate location (P625)の天体(globe)パラメータを設定するためのUIを追加します。

coordinate location (P625)の天体(globe)パラメータがlocated on astronomical body (P376)に準拠して設定されていない場合、LocatorBotのようなボットが検出することができます。located on astronomical body (P376)を追加し、ボット作業による位置座標の天体(globe)の更新を待つ方法は受け入れられている次善策です。

技術的な詳細

Wikibase JSON型では各値は"datatype": <datatype>, "datavalue": {"type": <type>, "value": ...}で記述され、valueの記述はtypeに依存します。

RDF形式ではデータ型は以下の表のhttp://wikiba.se/ontology#で始まるRDF nameによって記述されます。ダンプの場合はwikibase:です。ウィキデータクエリサービスでもこの接頭辞を使えますので、?prop wikibase:propertyType wikibase:Stringはデータ型の全てのプロパティを返します。

NameJSON datatypeRDF nameJSON typeImplemented byLinks
項目wikibase-itemWikibaseItemwikibase-entityidbuilt-inlist, query
プロパティwikibase-propertyWikibasePropertywikibase-entityidbuilt-inlist, query
語彙素wikibase-lexemeWikibaseLexemewikibase-entityidWikibaseLexeme (Q28925815)list, query
語義wikibase-senseWikibaseSensewikibase-entityidWikibaseLexeme (Q28925815)list, query
語形wikibase-formWikibaseFormwikibase-entityidWikibaseLexeme (Q28925815)list, query
スキーマentity-schemaEntitySchemawikibase-entityidWikidata Entity Schema (Q73505550)list, query
単一言語テキストmonolingualtextMonolingualtextmonolingualtextbuilt-inlist, query
文字列stringStringstringbuilt-inlist, query
外部識別子external-idExternalIdstringbuilt-inlist, query
URLurlUrlstringbuilt-inlist, query
コモンズのメディアファイルcommonsMediaCommonsMediastringbuilt-inlist, query
地理形状geo-shapeGeoShapestringbuilt-inlist, query
表形式データtabular-dataTabularDatastringbuilt-inlist, query
数式mathMathstringMath (Q21677559)list, query
楽譜musical-notationMusicalNotationstringScore (Q21678392)list, query
数量quantityQuantityquantitybuilt-inlist, query
時刻timeTimetimebuilt-inlist, query
緯度経度globe-coordinateGlobecoordinateglobecoordinatebuilt-inlist, query

制限

  • Point in timeは時刻に対応していません。 phab:T57755
  • Quantityinfinity (Q205)に対応していませんので、prime number (Q49008)quantity (P1114)無限大などとは書けません。

保留中のデータ型

以下はいずれも実装予定日が未定です。実装されないうちは既存の datatype で対応を続けます。

参照: Wikidata:Development plan

実行予定

継続時間

HH:MM:SS 形式で時間を記述。

計画中

計算済みプロパティ

ウィキベースが算出した結果をそのまま項目に適用するプロパティ。具体的な開発計画なし。

使用例: 項目に対する文の件数。

天球座標

天体の位置を示す座標形式。具体的な開発計画なし。

現状の次善策:Wikidata:Property proposal/Astronomical coordinates参照

整数データ型

正の整数値の数量データ型。これは精度を部分的に落とし、integer constraint (Q52848401)を作成することによって実装されました。

単一文字列項目

どの言語で説明するか制限がない代わりに、ラベルが1件しかないデータ型。具体的な開発計画なし。

現状の代替案:語彙素

評価中の代替案:複数のラベルを繰り返す代わりに多言語ラベルをひとつ使う

多言語の文字列

多言語への翻訳を求められる文字列。非ローカル形式のエンティティ名に使用する可能性があり、さまざまな言語およびスクリプトシステムに翻訳されます。 (多言語テキストは翻訳中に多くの手作業が関わる点にもご留意ください)。実際の使用目的は要検討。

複数行テキスト

改行を含むことができる文字列。

リモートプロパティ

リモートのリポジトリに置かれたプロパティで、固有のデータ型を持たず、既存のエンティティの特別なフィールドを介して識別される可能性があります。

連続する値

さまざまな時点の異なる値の集合を保存する単純な方法。具体的な開発計画なし。

チェス

position in Forsyth-Edwards Notation (P6648)のように、直接、FEN表記で文字列をチェス盤状に表示。

ヒエログリフ

WikiHieroを使って文字列を表示。文字列をWikiHiero の文法に従い、<hiero></hiero>に埋め込んで表示。サンプルはTalk:Q68101340Property_talk:P7383をご参照ください。

Phabrilator のやることリスト。

人間に読める数字のIDの組み合わせ

数字のIDとMediaWikiのページ名を追加するためのデータタイプ。修飾子としてMediaWiki page ID (P9675)が追加できます。数字のプロパティを直接使うプロパティもあります。

Wikibaseの文

Wikidata中の特定の文を示すためのデータ型

正規表現

正規表現(regex)を格納するためのデータ型。今は文字列または単一言語テキストとして格納されています。例: format as a regular expression (P1793), format as language specific regular expression (P8770)

IPアドレスの範囲

アドレス範囲を格納しクエリを簡便にするためのデータ型。

提案のみで実装されなかったデータ型

真偽値

却下。代替案: item-datatype。

データ型の変更

「文字列」データ型のプロパティは管理者によって「外部識別子」データ型に変換できます。このような変更を提案するには、当該するプロパティの議論ページもしくはプロジェクトのチャットで新しい話題として提示します。合意が形成されたら、要求をWikidata:開発チームに連絡することができます。2016年以前に作成されたプロパティを変換したい場合は、過去の議論を読んでおくべきです。

その他のデータ型の変更は、新しいプロパティの作成と古いプロパティの削除を必要とします。このような要求にはWikidata:プロパティの削除依頼を利用すべきです。

関連項目