楽々

何事も楽しくなければ長続きしませんね.よく,データ解析に費やす時間の7割以上がデータの準備作業に費やされるといわれます.ここで挫折することが多いのもうなづけます.目標がはっきりしないまま,単調な準備作業を続けなければならないとしたら,それは苦役でしかありません.

ディープ

一口にデータ解析といっても,人により,場合により,そのイメージはずいぶん異なります.あらかじめ目的が定まっていて一直線に処理するだけなら話は比較的簡単です.しかし「手持ちのデータからなにか役立つことが見つからないか」が目的だとしたらどうでしょう. 目的地を探しながらの旅を始めることになります.実際には,ある程度目的が定まっていることが多いのですが, 満足な結果を得るためには多くの試行錯誤が欠かせません.データの準備作業に多くの時間を費やしてしまったら,ここに時間をかけることができなくなることは目に見えています. しかも,あちこち掘り返してみるだけでは,時間がいくらあっても足りません. ねらいを定め,深堀りして初めて本当に役立つ結果が得られるのです. これは我々の長年の経験からもいえることです.

TRAD

ディープなデータ解析を楽しく行える環境として,これまでの長年の研究成果を盛り込み,実証実験を重ねることで出来上がったソフトウエア環境が TRAD です.

TextilePlot, R and DandD

高次元データそのままの姿をグラフィカルに表現する TextilePlot と,データサイエンス実践の基本的な道具となった R, インターデータベースのサポートも含めた「データとその属性の一体化」ツールである DandD(Data and Description)を統合した環境を提供するソフトウエアがTRADです.すべて JAVA でプログラムされています.

ここ一年ほどのブラッシュアップによって,機能の拡充や処理速度の向上などか計られ実用の域(state of art)に近づいてきました.単純なCSV ファイルだけでなく,複数のテーブルからなる CSV ファイル,転置の必要なテーブルを含む CSV ファイル,複数シートのエクセルファイルのサポートだけでなく,十数万行に渡るテーブルや,数千カラムからなるテーブルもストレスなく扱えるようになりました.日々精力的にアップデートしておりますのですので,ご期待ください.

まずは,URLパネルにある Example インスタンスを試してみてください.さらにお手持ちの CSV ファイルをドラッグしてみてください. また,厚労省の 300 以上のファイルからなる患者調査データを DandD ライブラリー化したものもダウンロードできますので,これらもお試しください.このライブラリー作成が TRAD の実用性をずいぶん向上させました.TRAD がどんな環境かご理解いただければ幸いです.

Example インスタンスはネットワーク経由で取得しますし,データソースへネットワーク経由でアクセスするインスタンスもありますので,エラーが起きたときは,まずネットワークに接続しているかどうか確かめてください.

ダウンロード(無料)

TRAD の実行にはJAVAの実行環境 (JRE) がインストールされている必要があります.

TRAD20170817 版から,TRAD の .TRAD ディレクトリにあったユーザファイルの名前を conf.TRAD と .TRADhistory に変え,TRAD 本体から独立したワーキングディレクトリに収めることで,簡単にインストールやアップデートできるようにいたしました. 詳細はドキュメントをご参照ください.

TRAD

Windows版ZIPファイル

Mac版ZIPファイル

ドキュメント

TRADヘルプPDFファイル

DandDインスタンスライブラリ

解凍後,ディレクトリ PatientSurvery を TRADのインストールディレクトリのサブディレクトリ DandDlibrary の直下に移動してください. これだけで TRAD の DandDライブラリータブから簡単に利用できます.

厚労省患者調査データDandDインスタンスライブラリZIPファイル