【Twitter分析】「ピケティ」がどう話題になっているかを調べる

先日、統計フリーツールのRを使って、Twitterを分析してみました。

Twitterの分析が地方政策の立案やマーケティングに活用できるか試してみた

地名をキーワードにしたTwitterを抽出して分析したんですが、今回は別の流行ワードでやってみようかな、と。

選んだのは「ピケティ」です。もう流行り過ぎってぐらいですよね。僕は雑誌のピケティ特集を読んだりとか、パリ白熱教室を観たぐらいで、「21世紀の資本論」は読んでませんが。

話題の経済書「21世紀の資本論」は、格差拡大への警鐘である

 

さて、今回はTwitterのつぶやきに「ピケティ」というキーワードを含むものを6000件ほど取得しました。時系列で件数を表すと、次のようなヒストグラムになります。一日あたりの件数は結構多くて、1500~2000件程度。なので、ほぼ3日分ぐらいの計算です。

hist

 

で、これをRMeCabを使って形態素解析して、名詞を抽出、ネットワーク分析にかけます。それで出たのが以下の図です。(N-gramは3の結果を表示してます。)

ピケティ

「アベノミクス」や「民主党」という言葉が、「便乗」や「批判」というキーワードと並んでいます。このあたりは、やはりピケティが分析した結果、主張した内容が、今の日本社会や政策にどう影響するかを照らしあわせ、賛同・批判に関する様々な記事が出ているからでしょう。

 

「ピケティ アベノミクス」で検索して目についたものでも、こういうのが上の方にあがってきます。

ピケティが指摘するアベノミクスの弱点 | 最新の週刊東洋経済 | 東洋経済オンライン | 新世代リーダーのためのビジネスサイト

ピケティでアベノミクス批判する残念な人々 | インフレが日本を救う | 東洋経済オンライン | 新世代リーダーのためのビジネスサイト

 

また、「鈴木」「寛」というキーワードも見えますね。どうやら、この記事が話題になっているようです。

ピケティの言う「教育で格差は縮まらない」は本当か|鈴木寛「混沌社会を生き抜くためのインテリジェンス」|ダイヤモンド・オンライン

 

Twitter上で、キーワードを中心に何がどういう文脈で語られているか、ということに関しては、ある程度推測できているように見えます。ただ、もう少し分析に関する情報が欲しいところですね。

今日はこのへんで。

Twitterの分析が地方政策の立案やマーケティングに活用できるか試してみた

データ分析に関心を持っている今日このごろですが、Rを使ってTwitterの情報からキーワードを抽出して、ネットワーク図を書いてみました。地域名をキーワードにしたとき、どういう内容がTwitterで話題になっているのか、パッと可視化することができるかなと思いまして。

 

地域名を含んだつぶやきを分析してみた

以下が、2/11から2/16までの期間で、「岐阜市」をキーワードに抽出して分析した結果です(厳密には、N-gram4でネットワーク分析してます)。およそ4,000件ぐらいになりました。

gifu

名詞だけが抽出されていますが、なんとなくどういうキーワードが話題になっているのか、わかりますね。道路の通行止め、子猫の里親募集などが話題になっていることがわかります。ラブホの名前も入ってるようですね。

このあたり、つぶやいた人がどれぐらい信頼性が高い人なのか、定型文をつぶやいてるボットみたいなものなのかで、重要性を判断できると面白そうな気がします。

 

ただなんというんでしょう。あんまり話題がないなって正直思ってしまったんですが、どうなんでしょう。Twitterなどソーシャルメディアの情報を分析して、マーケティングや地方政策に活かそう、みたいな話を聞くんですが、

他の都市も見てみようと思います。

nagoya

名古屋市は内容すらよくわかりませんでした。笑

 

今回の分析結果だけでなんとも言えないとも思うので、もう少し定点観測してみても良いかもと思っていますが、Twitterユーザーの傾向としては、次のような分析結果があります。

相関ランキングを見ると基準地価:商業地や基準地価:住宅地、基準地価:工業地などとの正の相関が非常に強い。Twitterユーザー数は地価とほぼ正比例していて、地価が高いほどユーザーが多いという結果を表している。

Twitterユーザー数 [ 2013年第一位 東京都 ]|新・都道府県別統計とランキングで見る県民性 [とどラン]

 

つまり、Twitterについていえば、都市型のソーシャルメディアであり、地方都市など人口が減っている地域については、マーケティングや地方政策には活用しづらいんじゃないか、という印象です。

あとは、もっと対象件数を数十万件規模まで増やしたり、地域ではなく企業名や商品名などでマーケティングに活用するなどは、アリかもしれないですね。

今日はこのへんで。

総務省「アプリDE統計」とOECDのデータアプリを使ってみた

総務省が、オープンデータの取り組みの一環として、iPhoneで統計データを簡単に見れる「アプリDE統計」をリリースしていました。

アプリDe統計 1.0(無料)
カテゴリ: ライフスタイル
販売元: 総務省統計局 – Statistics Bureau,Ministry of Internal Affairs and Communications(サイズ: 12.9 MB)
全てのバージョンの評価: 無し(0件の評価)
iPhone/iPadの両方に対応

総務省|「アプリDe統計」のiOS版の提供開始及びAPI機能のサービス拡充

アプリの機能は主に3つあって、以下のようになっています。

* City Stat → 地域の主要な統計情報をみる
* ポケット統計 → 主要な統計情報をみる
* とうけいどけい → クイズや自分用のグラフ作成

Toukei1

「City Stat」は、自分が住む場所や訪問した場所など、さっくり情報を知ることができるので、便利そうです。

Toukei2Toukei3

「ポケット統計」は、いろいろ統計情報が掲載されているのが良いのですが、横スクロールという非常に残念な感じでした。無いよりは良いと思いますけどね。

Toukei4Toukei5

あとは、人口や土地面積などのランキング機能があると良いな、と思いました。というか、誰かそういうアプリ作ってくれれば良いのですが。

 

また、参考のためにOECDがだしているiPhoneアプリも見てみました。

OECD data 1.0(無料)
カテゴリ: 辞書/辞典/その他
販売元: OECD – Organisation for Economic Co-operation and Development (OECD)(サイズ: 4 MB)
全てのバージョンの評価: 無し(0件の評価)

英語ですが、データごとと国ごとにタブで分かれていて、それぞれで豊富にデータの内容を見ることができます。

OECD1

また、データからみると国ごとにランキングになっていて、グラフで表示されていることも○。スマートフォンという狭い画面でもうまく時系列推移などの情報を見せる工夫がされているな、と感じました。以下の画像はちょっとわかりづらいですが、右半分にある年代をスクロールで変えることができます。

OECD2 OECD3

全体として「統計DEアプリ」より操作性やデザインなどは良い気がします。ただ、なぜか僕のiPhone6だと、トップページの縦スクロールが機能していなくて、全てのデータや国をみることができませんでした。

 

オープンデータやオープンガバメントというのは、壮大なテーマであるものの、効果が見えづらいことからいまいち必然性に弱いところがあります。ただ、こうやって簡単に統計データを調べられると、統計を活用する場面が増えてくることが期待できるでしょう。ネットや普段の会話では、ファクトが曖昧なまま議論されることも多くあります。そういうときに、さくっと調べてファクトを確認できると、より建設的な議論が生まれるんじゃないでしょうかね。

「マネーボール」はこれからデータ分析を導入したい企業必見の映画

野球を統計学で捉えることで、少ない投資でチームに勝利を導く。そんな実話を描いた映画「マネーボール」を見ました。

いやー面白かったですね。ブラッドピットの演技も良かったです。ひとつのエンターテイメントとして楽しめました。

 

「マネーボール」はデータ分析による弱者の戦略

映画「マネーボール」では、あまりデータ分析の内容は深くは踏み込まれていませんが、野球に勝つために必要な要素を抽出し、その確率を高めるための選手をデータから導き出すものです。詳しくは、Wikipediaに書いてあります。

マネー・ボール – Wikiwand

資金が乏しいチームが勝つために、他の資金が豊富なチームが見ない要素をデータから抽出し、勝ち点をもたらす選手を安く獲得できることを狙った「弱者の理論」でした。その理論を実行し、チームをつくっていったのがGMのビリー・ビーンです。この映画では、ブラッドピットが演じています。

 

データ分析の結果をどこまで信じるか

ビリー・ビーンは、データを重視することで、他チームが目をつけていない=年棒が安く獲得しやすい選手を獲得しようとします。しかし、そこでチームにいるベテランスカウトと対立が起こるのです。

  • あいつは守備が下手だ
  • 日常の生活が荒れている
  • 年を取りすぎている

などなど。ここでは、「データは一面しか見えず、ベテランのスカウトは総合的に人を判断できる」という見方と、「人の観点は時に論理的でなく、過大評価・過小評価を招くことがある」という対立が生じています。

この対立が描かれているところに、「マネーボール」の面白さがあるなと思いました。どの組織でも、こういう対立が起こりそうな気がしたのです。

 

ダニエル・カーネマンは「ファスト&スロー」で、人には直感的に素早く情報を処理する「システム1」と、論理的に思考して理解する「システム2」の2系統があると説明しています。初めての人と会って、見た目でいろいろ判断するのがシステム1、計算などを行うことで、システム1よりはゆっくりと物事を理解するのがシステム2です。

参考:心理と行動の関係が理解できる「ファスト&スロー」

つまり、人は少ない情報から様々な特徴やパターンを抽出し、判断することができます。自分が得た経験に裏付いた直感みたいなものは、コンピュータで真似するのは結構難しいのも事実です(システム1)。一方で、データを分析し、その分析結果を論理的に理解するのは、時に直感に反する場合があります。それがシステム2です。どちらも完璧ではなく、良い点・悪い点があり、それぞれを補完するのが望ましいのだろうと思います。

データ分析を組織に導入する、というのは、従来のやり方を変え、当たり前と信じられていたことを否定することもあるでしょう。この映画は、そういう点が描かれており、非常に参考になります。

 

データ分析を活用するために組織に必要な人材とは

当たり前の話ですが、データ分析をどう活用するかは人次第になります。「マネーボール」では、主人公であるビリーがデータ分析の価値を認めたからこそ、実行に移されました。しかし、実行に移しても内部でスカウト、監督、選手からの反発があります。「そのデータだけで方針を決めるのか」と。

それでも、価値を信じて説得し、チームを形成していきます。それを遂行するGMであるブラッドピットは、まさにチームマネジメントであり、変革をもたらすリーダーでした。結局、人がそれに価値を認めないと、価値は価値ではなくなるのだな、と思いながらみていました。

 

また、野球以外にも様々なスポーツでデータ分析が導入されてきています。サッカーにもデータ分析の波がきており、最近だと元日本代表監督の岡田さんがデータ分析をこれから一層活用する、と言っていました。

岡田武史氏と考えるスポーツ・イノベーション(前編) – NewsPicks

データ分析はどんどん進化しており、データを可視化して傾向を出す、というだけでなく、様々な特徴や規則性などを自ら導き出すこともできるようになっています。それらをビジネスで活用し、結果につなげていくための人が必要になります。具体的には、データ分析の価値を認め、ビジネスに取り入れる決断をできるリーダーと、ビジネスとデータ分析の両方を理解し、データとビジネスの関係を繋げられるアナリストです。「マネーボール」でも、この両方が出てきます。(どうやら、アナリストの方は体型などのイメージが原作の人物と違うらしく、名前が変わっているようですが。)

そういう意味でも、どういう人材がいればデータ分析を使ってビジネスにインパクトを与えられるのか、組織の形成という点でも役にたつ事例だと思います。

 

それ以外でも、人間ドラマとしても良い映画でした。年末のお楽しみにぜひどうぞ。

R言語で文字列の類似度を計算する

a1380_001345

ビッグデータによる解析で注目されているのは、文字列解析です。

数値解析はこれまでも行われてきましたが、非定型で定量化されていない文字列のデータをどう解析するかは大きな課題でした。しかし、いろいろ解析手法が編み出されてきており、かつIT技術の進歩によって膨大なデータを取り扱えるようになっていることから、現実的に使える分析になっています。

これまでR言語による分析をはじめたと書いてきましたが、今回は具体的な文字列解析に関する内容を書いておこうと思います。

 

文字列の類似度を定量化する

2つの文字列を比較して、どの程度類似しているかを定量化します。いろいろ手法はあると思っていますが、とりあえず使いやすそうなのは「レーベンシュタイン距離」です。

レーベンシュタイン距離(レーベンシュタインきょり)あるいは編集距離(へんしゅうきょり)は、情報理論において、二つの文字列がどの程度異なっているかを示す数値である。具体的には、文字の挿入や削除、置換によって、一つの文字列を別の文字列に変形するのに必要な手順の最小回数として与えられる。

レーベンシュタイン距離 – Wikipedia

R言語の場合、「MiscPsycho」というパッケージにレーベンシュタイン距離を計算できる関数が用意されています。R言語ってこういうパッケージで簡単に用途を広げられるのが素晴らしいですよね。

aとbの文字列の類似度を計算する場合
library(MiscPsycho)
string(a,b)

 

文字列の全てではなく特定のキーワードを抽出する

文字列の比較を行うにしても、全てを単純に比較するより単語を抽出した方が効果的な場合もあります。そういう場合は、名詞だけを取り出してみましょう。

R言語では、「RMeCab」というパッケージで簡単に名詞などに分解するような、形態素解析を行うことが可能です。

aの文章を形態素解析する場合
library(RMeCab)
result <- RMeCab(a) # 形態素に分解したリストが生成される
unlist(result) # リストを表示

基本的な操作は以下の資料を参考にしました。

 

OsakaR_3: R言語によるテキストマイニング入門 from Yuichiro Kobayashi

 

ちなみに、Macの環境でRMeCabのインストールがうまくいかなかったので、以下のリンクを参考に実施しました。

RMeCab – RとLinuxと…

 

これで、文字列の類似度を比較することもできるし、形態素解析を組み合わせて、比較の精度を向上させることだってできます。しかも、パッケージを2つインストールするだけで、R言語上ですぐに実行できるのだから、本当に良い世の中になったものです。勉強するための資料もインターネット上にたくさん存在しているし。利用しないともったいない。

今度は、株価分析もやろうかなーと思っていますよ。

データ分析したい人は、とりあえずR言語を使ってみよう

a0001_014308

前回の記事で、データアナリティクスを実際にやるためにR言語を学習し始めたと書きました。

「ヤバい予測学」を読んで「R」を学んだら、データアナリティクスの可能性を肌で感じた | Synapse Diary

引き続き、R言語を触っています。やってみて思ったことは、「実際に触っていると、分析の切り口が思い浮かぶ」「やりながら分析方法が改善されていく」ということです。

最初は、「何となくこういうことを分析したい」というところから始まったのですが、少しずつプログラムを組んでいくと、「ここをこうすれば、具体的な分析結果までいけるのでは?」と思いついたり、作ってる途中で「ここを変えれば、もっと良い分析ができるのでは?」と閃いたりします。

 

意思決定に影響を与えるデータ分析を行うために

会社を変える分析の力」では、データサイエンティストに求められる条件は、「どんな分析をするか構想する力」であり、その結果として組織の意思決定に影響を与える必要があると書かれていました。

データ分析が注目されていますが、一番高いハードルが、「結局分析して何の役に立つのか?」という点に応えるための、一連の流れを創りだすことにあります。そのためには、分析ノウハウも当然必要ですが、業務に結びつけるイメージも同時に持つ必要があります。

 

人のタイプにもよると思いますが、個人的にはやはり分析ツールや方法を実際に知らないと、意思決定に結びつけるまでイメージするのは難しいと思います。そして、R言語を弄ぶことで、漠然と描いていた、データ分析から意思決定までの流れが少しずつ具体的にイメージできることを体感しました。

 

データ分析には限界がある

また、R言語を触ってみるとデータ分析には当然ながら限界があることもわかります。ある程度、人手でカバーしたり、完璧をもとめず有用な分析結果を取り出すよう、「割り切る」部分も求められるわけです。

そういうことも含めて、データから良い分析結果を取り出すまでのフローを設計することが、データサイ分析の現場では求められます。

今回、文字列の類似度を計算したり、クラスター分析したりしてみましたが、文字列の類似度も完璧に機械化できるわけではなく、人間の感覚とは違います。また、クラスター分析だっていろんな手法があり、自分がイメージするように綺麗にクラスターとして分けてくれるわけではありません。こういう壁にぶつかるとイライラしてきますが、一定の限界を受け入れなければいけないわけです。

それと同時に、クラスター分析にいろんな手法があり、それを改善する方法もいろんな人が研究してるんだなーと感心もしました。奥が深い、統計分析の世界。。。。

 

まだR言語の書籍買わず、ネットで調べただけですが、フリーツールで、膨大な情報があるというのは、本当にありがたい時代だなって実感します。

Slideshareあたりで参考にした資料を貼っておきます。とりあえずこれらを読めば、いろいろ分析に着手できますよ。

 

 

 

 

 

「ヤバい予測学」を読んで「R」を学んだら、データアナリティクスの可能性を肌で感じた

ビッグデータやデータアナリティクスという言葉が、すっかりバズワードになっている気がしますが、実用的なネタはそれほど多くなかったり、まだ実際の業務で当たり前に使うってレベルではありません。むしろ、これからもっと実用的なレベルになっていくんだと思います。

 

「ヤバい予測学」を読むとデータ分析したくなる

 

「ヤバい予測学」を読んだのですが、予測に必要なアナリティクスのアプローチや実例を、丁寧に順を追って説明してくれます。シンプルな予測モデルの作成にはじまり、複合的な予測モデルの組み合わせによる精度向上、人工知能の実態なども具体的な分析のイメージを与えてくれます。

合わせて述べられる豊富な実例は、自分の業務などにどう活かせるかを考えながら読ませてくれるので、すごい刺激を受けます。

組織的にどうやってデータアナリティクスを導入していくか、という点では「ビッグデータ・アナリティクス時代の日本企業の挑戦」が面白いですが、具体的なデータ予測の中身を学ぶのであれば、「ヤバい予測学」の方が良いです。

 

分析したくなって「R言語」の学習をはじめた

「ヤバい予測学」を読んで、たまらなく分析してみたくなったので、統計解析ソフト「R言語」をインストールして、勉強してみることにしました。

The Comprehensive R Archive Network
[browser-shot url=”http://cran.r-project.org/” width=”600″ height=”450″]

少し触ってみてわかりましたが、基本的な統計分析ができるようになっていますし、数千行にもおよぶデータ群を読み込ませても、ヒストグラムなども簡単に解析できます。複雑な計算でも、スクリプトを書けばできますし、構文もそんな難しくありません。ただ、データモデルはちょっと独特な感じがしますね。

 

いろいろ試行錯誤しながら、文字列の類似度を評価して、クラスター分析してみました。文字列の類似度を計算するメソッドが用意されていることにも、驚きを覚えました。コマンドひとつで実施できるわけですから。

文字列の類似度を測る(1) レーベンシュタイン距離|Colorless Green Ideas

それ以外にも、全然業務に関係ないけど、株価予測とか企業の倒産確率とか面白そうだなーと思ってます。

R言語を用いた自己回帰モデルによる株価予測を試してみた – Yuta.Kikuchiの日記
Rで学ぶ『構造型モデル de 倒産確率推定』

 

知識として理解することも重要だけど、実際に自分で触ってみると「実感」としての理解が進みますよね、やっぱり。データアナリティクスは、改めていろんな可能性が広がってるなって思いました。

しばらく分析ネタに飢えていると思うので、良い分析ネタがあれば、誰か教えてください。

ビッグデータ・アナリティクス時代の日本企業の挑戦

ビッグデータやアナリティクスというのは、すっかりバズワードみたいな感じになっていますが、実際、ビッグデータ・アナリティクスに求められる要素はなんでしょうか。

この「ビッグデータ・アナリティクス時代の日本企業の挑戦」では、様々な企業がITを活用して、自分たちのビジネスモデルを発展させようとする取組みが紹介されています。

本書のテーマはこれです。

新しい技術の存在は認めつつも、手を出せない大企業。しかし、そんな大企業の中にもこの変化に対応しようとする組織が登場しつつあります。それらの組織がいかにして「組織の壁」を超えたのか。

IT技術はめまぐるしく発展し、事業スピードも速くなっています。その中で、変化に対応するというのは、企業戦略上非常に重要な要素です。

 

ビッグデータ・アナリティクスにいろんな企業が取り組んでいる

この本では、いろんな企業の取り組む事例が紹介されています。

スターバックスは、「フォースプレイス」という概念を提唱し、Web上で顧客体験を向上させる取組みを進めています。

ここに近年、第4の場所「フォースプレイス」構想が加わりました。この「フォースプレイス」とはTwitterやFacebookといった「デジタル空間」を指しています。
この「フォースプレイス」によって今まで店の中でしか築けなかった「スターバックスの経験」を店の外に拡張できるようになりました。ソーシャルメディアを中心としたデジタルによる顧客との新たなタッチポイントはすでにFacebook3190万、Twitter288万フォロワーに成長し(スターバックス本体の数字)、物質の世界で培ってきた40年間の顧客との信頼関係を「店」の外へ複製し、経験を共有することが可能になりました。

日テレは、ネットとの融合を進めることで、視聴者の同時視聴による体験の向上と、視聴率に代わるメディア価値の可視化を進めています。最近では、Huluを買収してましたね。

トヨタが「トヨタフレンド」というSNSを展開していたことは、この本で初めて知りました。車に乗っていない時も「車とブランド」を想起してもらうのが狙いのようです。

【プリウスPHV 3か月検証】SNSトヨタフレンド、見えてきた成果と課題 | レスポンス

それぞれが、どのような経緯から取り組むことになったのかは、本を読んでいただければわかります。

 

スモールスタートで推進する仕組み

とても当たり前の話になってしまいますが、事業環境の変化がとても早く予測が難しいので、いかにクイックに立ち上げてPDCAサイクルを回すかが重要になっています。クラウドなど低価格で利用しやすいITサービス環境が整ってきたことも後押ししています。

あとは、組織の問題ですね。本書の事例でも、やはり担当者やリーダーの一声で「まずはやってみる」という流れが生まれてから進んでいるケースがありました。大きなミスをしないようガバナンスすることも重要ですが、勢いを生み出して進んでいくことも非常に重要になっています。

そういう意味では、上記に挙げた事例が「成功している/していない」の尺度だけで評価されるのではなく、アイデアや組織も含めて取り組むアプローチが参考になるんじゃないかと思います。

 

ビッグデータやデータアナリティクス系の本は増えていますが、日本を含めて事例を細かく記載した本はあまりないんじゃないでしょうかね。

【書評】会社を変える分析の力(河本 薫)

データ分析がブームです。元々分析チックなことは好きな理系だったのですが、このブームはいつまで続くやら、という感じがしています。とはいえ、データ分析が企業経営に役立つ手段のひとつであることは間違いありません。

今回は、データ分析が企業を変えるためには、どのようなアプローチが必要かが書かれた本を紹介したいと思います。

本書の論旨は簡潔です。データ分析の目的は、「分析結果をいかに意思決定につなげるか」。企業の様々な意思決定に役立たなければ、どれだけデータ分析しても、自己満足や使われない分析結果になります。

データはビジネス分析に十分に活用されていない

ビッグデータがバズワードになっていますが、確かに世界ではデータ量が著しく増加しています。

  • 2020年までに40ゼタバイトまで増加する。2012年が2.8ゼタバイトだから、14倍以上増える計算になる。(ゼタバイトは、ギガバイトの10億倍)
  • マシン由来のデータが、2005年は11%から2020年には40%にまで増大する。
  • ビッグデータに有効と思われるデータは、全体の23%程度。現状は0.5%程度しか利用されていない。(ここがビジネスギャップ)
  • セキュリティの観点から、保護されるべきデータのうち半分しか実際は保護されていない。

ASCII.jp:2020年は40ZB!デジタル・ユニバースの未来とは?

ビッグデータに有効と思われるデータが全体の23%、という根拠もよくわからないですが、とにかくあまりデータが利用されていなくて、そのギャップにこそ商機がある、というのが今のビジネスシーンのようです。

しかし、ビッグデータに限らず、もっとデータ分析を行い、業務に活用する機会があるのでは、というのが本書に書かれていました。僕もそう思います。

業務システムに保存されているデータの多くは、分析されたこともない宝の山です。しかし多くの企業ではビッグデータへの関心が高まる反面、リトルデータへの関心が薄らいでいるように思えます。ソーシャルメディアの莫大なデータを分析する前に、社内の営業データは十分に分析できているか自問してみましょう。秒単位のデータを分析する前に、日次データは十分に分析できているか自問してみましょう。

中小企業であれば、ExcelとかAccessからスタートしても、集客に向けたマーケティングやリピーターの確保のためのデータ分析ができるんじゃないでしょうか。

リピーターになる時期は予想できる | Synapse Diary

データサイエンティストに求められるスキルとは?

データサイエンティストが今最もセクシーな仕事で、世界的に不足していると言われていますが、これは統計学の知識があったり解析ソフトの扱いに長けているだけではないことは、本書を読むとよくわかります

それらはあくまで前提であり、最も重要なことは、分析結果が組織の意思決定に影響を与えるようになることです。そのためにはたくさん壁があるのですが、それは本書を読んでください。

現在は、ITの恩恵で、どんな分析でも、誰もが簡単に実行できるようになったのです。そのような時代では、分析を実行する力よりも、どんな分析をするか構想する力が問われるのです。

データサイエンティストは、企業における問題とデータとをつなげる役割を担います。それはこのスライドを見てもわかります。

また、ビッグデータによる全量データ解析が進み、重要なのは相関関係にシフトすると言われていますが、やはり因果関係まで特定することは重要です。因果関係が特定できることで、解決策に汎用性が生まれ、発展が生まれるからです。そして、相関関係から因果関係へ導けるのは、今のところ人間だけです。

ということで、データを分析したい人も、データ分析を組織に活用したいと思う人もこの本を読みましょう。仕事や経営に常に問題意識を持ち、データ分析と結びつける感覚が養うことができると思います。

リピーターになる時期は予想できる

ビッグデータとか、データアナリティクスという言葉がバズっていますが、個人的にはデータ分析にはビッグもスモールもなく、重要だと思っています。それは企業経営、特に中小企業でも同じです。それはこの本を読んで、改めて確信した次第です。

久々に目から鱗でした。詳しいアプローチや考え方は本を読んでいただくとして、確かにこの方法を駆使すれば、リピーターの時期や予測できるようになるでしょう。有名な「やずや」で編み出された手法とのことです。

 

データ分析に必要な設備投資

データ件数が少ないうちは良いですが、最もオフィスで馴染みがあるExcelでも数千件レベルになってくると、だんだんファイル操作が重くなってきます。やはりAccessや他のソフトやサービスなど、データベースを整備する必要が出てきます。

中小企業は日報管理や取引管理などのデータが存在しないか、あるいは存在していてもパッケージ製品などでフォーマットが固定されており、互換性などの処理も技術的にできない、あるいは人的にそういうリテラシーがない、という壁に当たり気味です。

なので、こういうデータ分析を行うためのデータ蓄積の業務アプローチと、それを実現するためのデータベースを含めた技術サポートが必要だと思っています。

 

中小企業を支えるクラウドサービスの台頭

一方で、中小企業や個人事業主が利用するハードルが低くなったクラウドサービスは、いろいろ台頭してきています。

無料の見積・請求書管理サービス misoca(みそか)|テンプレートで簡単作成
[browser-shot url=”http://www.misoca.jp/” width=”600″ height=”450″]

 

全自動のクラウド型会計ソフト「freee (フリー)」
[browser-shot url=”http://www.freee.co.jp/” width=”600″ height=”450″]

 

クラウド日報とはどんなもの? | クラウド日報
[browser-shot url=”http://workjournal.jp/?page_id=34″ width=”600″ height=”450″]

 

他にも海外では、いろんなサービスが登場してきているようです。

今年は中小企業もビッグデータとSaaSを有効利用できる | TechCrunch Japan

 

タイムマシン経営ではありませんが、日本も今後このようなサービスを受け入れる土壌ができて、たくさんのサービスが登場してくると思うと、非常に楽しみです。

というわけで、今後の企業経営のトレンドは、データ分析とクラウド利用だと思ってます。