GeoLOD

地名情報を集約する地名情報処理システム

GeoLOD - 地名情報を集約する地名情報処理基盤

GeoLODは地名に関する固有識別子(GeoLOD ID)を付与し、複数の情報源で共有することで、地名情報を統合処理するためのプラットフォームです。

GeoLODの概要

GeoLODは、地名への固有の識別子(GeoLOD ID)の付与を中心に、地名情報の登録・管理・表示・共有などを実現するウェブサービスです。 地名情報の登録には、地名辞書を作成してCSVファイルをアップロードする方法と、ウェブサイトで個別に地名を登録する方法の2種類を用意しています。 作成した地名辞書をGeoNLPの地名辞書として活用すれば、テキストからの地名の自動抽出にも活用できます。 また地名辞書のメタデータをSchema.orgのDatasetスキーマに合わせて出力し、Google Dataset Searchとの連携をしやすくする機能も用意しています。

またGeoLODは歴史ビッグデータにおける地名情報のハブとしても活用する計画です。 歴史ビッグデータの一つの目標は、史料に出現する地名を現代の地理空間に紐づけることで、空間的な分析を可能とすることです。 このとき、地名というテキスト情報と緯度経度という数値情報を地名の識別子を介して結合することにより、場所があいまいな歴史地名なども適切に扱えるようになります。 また過去の市区町村に関する統計情報を現代に接続するには、現在のところ公式の識別子が存在しない過去の市区町村に対して、 歴史的行政区域データセットβ版のように識別子を付与することも重要な課題です。

現在のところ、GeoLODの基本機能はおおむね完成していますが、まだいくつか実現できていない機能があります。 第一に、特に歴史地名の場合に問題となる場合として、地名の定義そのものに研究や検討を要する場合への対応です。 この場合は、非公開で地名情報を蓄積し、十分な検討が済んだ段階で公開する機能が必要となります。 第二に、地名の統合のための機能です。複数人が複数の地名辞書を構築する場合、同じ地名が複数回登録されることがあります。 これを事前に防ぐことは難しいため、事後に統合するための仕組みづくりが重要な課題となります。

GeoLODの初期バージョンは、Linked Open Dataとしての機能を備えており、SPARQL検索も可能となっていました。 一方リニューアルした現バージョンは、むしろ地名識別子に関連する機能に重点を置いており、Linked Open Dataとしての機能は備えていません。 将来的には、他の地名識別子や一般的な識別子と連携するための仕組みも備えたいと考えています。

より詳しい情報は、GeoNLPプロジェクト - オープンな地名情報システムのためのソフトウェア・データ・サービスをご覧ください。