InterDatabase

InterDatabase は異なるデータベースにまたがったデータの有効活用を促進するための仕掛けで,データサイエンス実践をサポートするインフラです. DandD インスタンスでは,データの値そのものを含める必要はなく,ネット上に存在するデータベース,データファイルへの参照で代替できるので,この機能を利用することで InterDatabase が実現されています.DandD インスタンスを用いれば異なるデータベースやデータファイルを参照することで生じる表現の違いも容易に解消でき,必要になった段階でデータの値そのものを取得すればよいので,取扱いは容易になります.また,DandD ではデータベクトル,つまりリレーショナルデータベースのデータテーブルの各列を単位として,すべてのデータを構成しますので,大きなデータベースでも,必要な部分を参照することで済みます.

参考文献

  1. 横内大介,柴田里程,インターデータベース --- DandD インスタンスのエージェント化 ---, 統計数理 49, 317-331, 2001.
  2. R. Shibata, InterDatabase and DandD, Proceedings in Computational Statistics 2004, Ed. J. Antoch, 465-475, 2004, Physica-Verlag, Heidelberg.

DandD

DandD は Data and Description (データとその記述)の略で,目的に応じてデータを組織化し,必要な背景情報やさまざまな属性の記述と一体化しておく汎用な手段です.具体的には,XMLドキュメント(DandD インスタンス)の形で実現され,これを解釈するサーバとさまざまなクライエントシステムの組み合わせで,ユーザは複雑な構造や属性に煩わされず豊かな解析が実現できます. 以下に紹介する InterDatabase も TextilePlot も DandD を基盤として構築されています.

参考文献

  1. R. Shibata and M. Sibuya, Formal description of data type for statistical analysis, Proceedings of the first IASC world conference, 203-212, 1987.
  2. 柴田里程,統計データとその属性記述の形式化,統計情報,38-6, 18-24, 1989.
  3. R. Shibata and M. Sibuya, User interface provided by D&D ( Data and Description ), Bulletin of the International Statistical Institute, 1/21, 1-25, 1991.
  4. 柴田里程,渋谷政昭,EJDA におけるデータ記述, 統計数理, 39, 85-96, 1991.
  5. 柴田里程,"データ解析の電子ジャーナル(EJDA)" の実働化, 統計数理研究所共同研究リポート, 54, 1994.
  6. D. Yokouchi and R. Shibata, DandD Client Server System, Proceedings in Computational Statistics 2004, Ed. J. Antoch, 2011-2018, 2004, Physica-Verlag, Heidelberg .