「ヤバい予測学」を読んで「R」を学んだら、データアナリティクスの可能性を肌で感じた

ビッグデータやデータアナリティクスという言葉が、すっかりバズワードになっている気がしますが、実用的なネタはそれほど多くなかったり、まだ実際の業務で当たり前に使うってレベルではありません。むしろ、これからもっと実用的なレベルになっていくんだと思います。

「ヤバい予測学」を読むとデータ分析したくなる

エリック・シーゲル阪急コミュニケーションズ 2013-12-18

「ヤバい予測学」を読んだのですが、予測に必要なアナリティクスのアプローチや実例を、丁寧に順を追って説明してくれます。シンプルな予測モデルの作成にはじまり、複合的な予測モデルの組み合わせによる精度向上、人工知能の実態なども具体的な分析のイメージを与えてくれます。

合わせて述べられる豊富な実例は、自分の業務などにどう活かせるかを考えながら読ませてくれるので、すごい刺激を受けます。

組織的にどうやってデータアナリティクスを導入していくか、という点では「ビッグデータ・アナリティクス時代の日本企業の挑戦」が面白いですが、具体的なデータ予測の中身を学ぶのであれば、「ヤバい予測学」の方が良いです。

「ヤバい予測学」を読んで、たまらなく分析してみたくなったので、統計解析ソフト「R言語」をインストールして、勉強してみることにしました。

The Comprehensive R Archive Network
[browser-shot url=”http://cran.r-project.org/” width=”600″ height=”450″]

少し触ってみてわかりましたが、基本的な統計分析ができるようになっていますし、数千行にもおよぶデータ群を読み込ませても、ヒストグラムなども簡単に解析できます。複雑な計算でも、スクリプトを書けばできますし、構文もそんな難しくありません。ただ、データモデルはちょっと独特な感じがしますね。

いろいろ試行錯誤しながら、文字列の類似度を評価して、クラスター分析してみました。文字列の類似度を計算するメソッドが用意されていることにも、驚きを覚えました。コマンドひとつで実施できるわけですから。

それ以外にも、全然業務に関係ないけど、株価予測とか企業の倒産確率とか面白そうだなーと思ってます。

R言語を用いた自己回帰モデルによる株価予測を試してみた – Yuta.Kikuchiの日記
Rで学ぶ『構造型モデル de 倒産確率推定』

知識として理解することも重要だけど、実際に自分で触ってみると「実感」としての理解が進みますよね、やっぱり。データアナリティクスは、改めていろんな可能性が広がってるなって思いました。

しばらく分析ネタに飢えていると思うので、良い分析ネタがあれば、誰か教えてください。