書籍
S, S-PLUS, R 関係
データ解析環境 S は 1980 年代に米国のベル研究所で開発された,探索的データ解析を支援する柔軟な環境です. 柴田は当初から開発に携わってきました.この S の商用版が S-PLUS であり,パブリックドメイン版が R です. したがって,R や S-PLUS を使うときでも S 関係書籍はほとんどそのまま利用できます.現在増刷 されていないので入手しにくいかも知れませんが,図書館や古書店で探してみてください. いずれも開発者たちの熱気が伝わってきますし,その背景を学ぶ上で欠かせない書物です.- 『S システム I, II』 R.A. Becker,J.M. Chambers 著,渋谷政昭,柴田里程訳 共立出版, 1987
- 『S 言語 I, II』 R.A. Becker,J.M. Chambers, A.R Wilks 著,渋谷政昭,柴田里程訳,共立出版,1991
- 『S によるデータ解析』 渋谷政昭,柴田里程著, 共立出版,1992
- 『Sと統計モデル -データ科学の新しい波-』 J.M. Chambers, T.J. Hastie 編,柴田里程訳,共立出版, 1994
- 『時系列データ分析』 横内大介,青木義充 著,技術評論社, 2014
- 『データ分析とデータサイエンス』 柴田里程 著,近代科学社,2015
S の前身「S システム」の解説書です.まだオブジェクト指向は導入されていませんが,その萌芽は伺えます.S の基本はこのシステムでほとんど確立しています.
ブルーブックと呼ばれている S の全貌を解説した本で,IはSの詳細, II はマニュアルです.
グリーンブックと呼ばれる書下ろしで,背景となるアルゴリズムや統計的方法を新たな視点でまとめ直してあります.本書で用いられているオブジェクトの R dump.
ホワイトブックと呼ばれる,Sを駆使した統計モデル適用の実践本です.線形モデルから始まり,分散分析, 一般化線形モデル,一般化加法モデル,局所回帰モデル,樹形モデル,非線形モデルまで幅広くカバーしています. 内容はかなり高度なところまで詳細が述べられていますが,必要なところだけを読み進めることができるよう工夫されています. なお,一般化加法モデル関係のオブジェクトはRの標準としてはインストールされていませんが,パッケージ gam をインストールし,library(gam) でライブラリー gam をロードすればすべてのオブジェクトが問題なく使えるようになります.
一橋大学大学院国際企業戦略科でのテキストをまとめたもので,データサイエンスの実践の一つとして R を用いたファイナンス時系列解析がある程度までできるようになることを目指している.自己回帰モデルや GARCH モデルのあてはめだけでなく,共和分を利用した株式投資への応用,クラスタリングのペアトレーディング への活用など実践的な話題も収められている.