ご相談・お問い合わせ
3 分で読むことができます

【DBpedia探索1】新潟のゆるキャラ一覧の取得

執筆者 BI LAB編集室 更新日時 2020年8月14日

DBpediaとトッキッキ

DBpedia探索

SPARQLのクエリ学習とDBpediaを理解するため思いつきでクエリを作っていく。

今回はうまさぎっしりスタンプラリーのマッピングで出会った新潟のゆるキャラたちをDBpediaから取得してみる。

先に結論を行ってしまうと全然ちゃんと取得できなかったので新潟県のゆるキャラ一覧がほしいという目的を持った人はここでお別れとなります。。。

全国の地域限定ゆるキャラ(地域別)

 

まずはDBpedia日本語版のトップページに例示されているクエリをそのまま実行してどのような結果が返ってくるか確認してみる。

<クエリ>

SELECT DISTINCT ?mascot ?name ?areaname
WHERE {
?areamascots skos:broader <http://ja.dbpedia.org/resource/Category:地域限定のマスコット> ;
rdfs:label ?areaname .
?mascot dbpedia-owl:wikiPageWikiLink ?areamascots ;
rdfs:label ?name.
}

※例示されているクエリではSELECTに?areanameを指定していないが今回は確認のために表示。

<結果>

全国の地域限定ゆるキャラ

クエリのタイトル通り、地域別にゆるキャラが取得できていそう。

 

全国の地域限定ゆるキャラ(都道府県別)

次に地域だけでなく都道府県も取得するよう試みる。地域別のクエリで取得した地域別のゆるキャラを主語(?mascot)とする全ての述語(?p)、目的語(?o)を取得。そしてその目的語(?o)のうち述語に都道府県名を持っている目的語(?pref)を取得する。

<クエリ>

SELECT DISTINCT ?mascot ?name ?o ?pref
WHERE {
?areamascots skos:broader <http://ja.dbpedia.org/resource/Category:地域限定のマスコット> ;
rdfs:label ?areaname .
?mascot dbpedia-owl:wikiPageWikiLink ?areamascots ;
rdfs:label ?name.
?mascot ?p ?o .
?o prop-ja:都道府県名 ?pref .
}

 

<結果>

全国の地域限定ゆるキャラ結果を見ると地域別では存在していたモジャくんやノッポンなどが消滅。調べてみると、これらのキャラクターが持っている目的語の中に"prop-ja:都道府県名"を述語とするものが存在しないから、都道府県が取得できていなかった。また、ドアラなどが2レコード以上存在するのはドアラの目的語にの中で"prop-ja:都道府県名"を述語にもつものが2つ以上存在していたためであった。

このあたりはWikipediaのデータの問題なのでこのまま進むことにする。

新潟県のゆるキャラ

あとは都道府県を新潟県に絞り込んで新潟県のゆるキャラのみを取得する。先程の都道府県別のクエリから都道府県名のrdfs:labelを取得し、FILTERを使用して新潟県に絞り込む。

<クエリ>

SELECT DISTINCT ?mascot ?name ?o ?pref_n
WHERE {
?areamascots skos:broader <http://ja.dbpedia.org/resource/Category:地域限定のマスコット> ;
rdfs:label ?areaname .
?mascot dbpedia-owl:wikiPageWikiLink ?areamascots ;
rdfs:label ?name.
?mascot ?p ?o .
?o prop-ja:都道府県名 ?pref ;
rdfs:label ?pref_n .
FILTER CONTAINS(?pref_n,"新潟県") .
}

 

<結果>

新潟県のゆるキャラ

少ない...

しかもつば九郎とかくまモンとか混ざってる...

スタンプラリーのスタンプになっているキャラクターですら33あったからプラスで余計なデータが紛れ込んでくるかと思っていたらそもそもWikipediaに登録されていない様子。

感想

人を取得する場合は出身地などを述語に指定すれば一意に都道府県を取得できるがゆるキャラの場合はそれに該当するような述語がなく苦戦。クエリ自体もまだ改善の余地がありそうな気がするのでそのうち再挑戦。

BI LAB編集室

執筆者 BI LAB編集室

BI LAB(データ活用研究所)編集室です。 BI、AI、DWHなどデータ活用に関するトレンドやニュースやコラムをほぼ毎日配信しています。押さえておきたい基本知識から、最新ニュース、事例インタビューやお役立ち情報・セミナーレポートまで、データ活用の専門家ならではの視点と情報量でお届けします。

 

こちらの記事もおすすめです

3 分で読むことができます。

【DBpedia探索2】新潟県にある新幹線の駅を調べてみる

2 分で読むことができます。

Twitterアカウントロック! ~解除までの道のり~

2 分で読むことができます。

プロ野球を支えるAIとは?WBCで活用された技術についてもご紹介