AmazonとGoogleがオンライン広告でガチンコ勝負に向かっている模様

ネット界の巨人同士が面白い展開になってきています。アマゾンが、オンライン広告市場に本格的に進出するというニュースがありました。

米インターネット通販大手アマゾン・ドット・コムが、オンライン広告市場で優位に立つ米グーグルへの攻勢を強めている。多数のアクティブユーザーの情報を生かした広告をインターネット上に掲載するための独自のソフトウエアを開発している。

アマゾン、オンライン広告事業でグーグルへの攻勢強める – WSJ

 

購買情報をずっと狙っているGoogle

Googleは、以前からずっとECサイトなどの購買履歴に関する情報を狙っています。Google認定ショップや、Googleホテル検索など、より購買行動に近いところまで進出してきているのは、購買データを自社で取り込みたいからです。それらの流れについては、以前このブログで書きました。

Google認定ショップがECサイトの救世主になるのか

それだけ、よりダイレクトに顧客の購買行動に近いデータは、広告のマッチング精度を引き上げるでしょう。グーグルはオンライン広告市場全体の1/3のシェアを占めていると言われていますが、Facebookも台頭してきてますし、タブレット・スマートフォンではGoogleを経由しない検索も増えており、精度向上は必至です。

Googleなどの大手検索エンジン、深刻な売上シェアの減少。検索に取って代わりつつあるニッチなアプリ | TechCrunch Japan

 

新しい広告プラットフォーム構築を狙うアマゾン

今回Amazonは、新しい広告プラットフォームを構築しようとしているようです。購買行動のデータを山ほど持っているAmazonとしては、広告の精度向上をアピールして市場に進出したいということなのでしょう。これまでも両社はクラウド・ストレージなどのサービスで衝突してきましたが、広告でも衝突することになります。

Amazonの強みは、単なるECサイトを運営する小売業者ではなく、テクノロジー企業だということです。なので、自社で蓄積したデータを使い、新たな収益源を構築することもできます。

結局、テクノロジーを使えるかが一番重要であることは間違いないですが、次はそのテクノロジーを活用するためのデータを持っているかが競争優位性になってきているのは間違いありません。

Googleは売上は伸びていますがクリック単価が減少してきており、やや苦戦の気配がしつつあります。

ニュース – GoogleのQ2決算は22%増収、しかし利益はアナリスト予測を下回る:ITpro

また、Amazonの戦略は常にペネトレーションプライスで勝負をしかけ、一気にシェアを奪うのがこれまでの王道手段になっています。

 

生活やビジネスに大きな影響を与える2社の動向は、本当おもしろいですね。

安心を得るために読む。自分でつくるセーフティネット: 生存戦略としてのIT入門

現代が生きやすいか、生きにくいか本当のところはわかりませんが、今の世相を捉える上で本書はわかりやすく面白いと思います。ライトでさくっと読めるのも、休日に読むのに良い感じです。

 

佐々木さん(@sasakitoshinao)の本って結構読んでいて、「「当事者」の時代 」とか「キュレーションの時代 」とか「レイヤー化する世界 」とか、時代の感覚やトレンドを掴み、表現される内容に納得感を持ちやすかったりします。

で、今回読んだのが「自分でつくるセーフティネット」。なんかわかりづらいタイトルだなって思いましたが、端的に今後の生き方を提案されていて、同意できる点が多かったです。

 

「政府や社会、企業が守ってくれる」感が乏しくなっている?

僕は就職したときから終身雇用は崩壊していましたし、「誰かが守ってくれる」感の変化というのはあまり感じていないのかもしれません。なので、本書の前半に書いてある、戦後社会からの変化については、「まあそうなんだろうな」という想像の世界ではありました。ただ、政府の財政は乏しくなり、人口減とともに地域コミュニティの力は乏しくなり、企業が従業員のコミュニティを維持することも少なくなってきているのは間違いないのでしょう。

一方で、インターネットの出現による社会の変化は、まさにリアルタイムで経験してきました。最初は穏やかでギーク的な匂いがしていたインターネットは、いろんな人に広がっていくについて、何か「極端に振れやすいな」と感じる場面が増えてきました。湿原するとすぐに誰かが叩かれたり、ちょっとしたことで個人情報が暴かれたりしています。

そうやって、安心を提供できる力が社会全体で弱くなっていっている、というのが前提となる背景になっています。

 

「弱いつながり」を維持するコストが小さくなっている

以前から「弱いつながり」というのは、自分にとって新しいアイデアや機会を与えてくれるものだというのは、研究結果なども含めて言われてきたことです。ただ、インターネットやSNSが登場する以前は、「弱いつながり」を維持するのが結構大変だったんじゃないかと思います。

時々、忘れた頃に手紙書いたり、訪問したり、電話したり。でも、コミュニケーション手段に限りがあるので、伝えられる情報に限りがあります。一方で、FacebookなどのSNSは、近況がタイムラインに流れてきて、必要なときはそのままメッセージのやりとりなども行うことができます。SNSの優位性は、「常に近況をおおよそ把握しており、「つながっている」感がずっと維持される」という感覚の特異性にあると思っています。

実際、Facebookを使い始めてから、実際は直接やり取りをやっていない人でも「縁が切れた」「疎遠になった」という感じが自分の中でないですし、何年か経って唐突に連絡してみる、ということも起こっています。不思議なものです。

というわけで、「弱いつながり」を維持するコストは、SNSの登場で劇的に下がったといえるでしょう。それが本書でいう「セーフティネットの役割」を果たすのだと思います。

 

多様なコミュニケーションツールを使いこなす能力

FacebookやTwitterが巨大でメジャーなSNSになっているのは間違いないですが、一方で、LINEなどクローズドなコミュニケーションが主流になってきているとも感じています。これは、オープンなコミュニケーションだけでは全てが成立するわけではないということ、人にはいろんなコミュニケーションのパターンやニーズが存在するからだと思っています。社会性や時代のトレンドなんかもあるかもしれません。

今後もしばらくはFacebookやTwitterの優位性がすぐに崩れる、ということではないかもしれませんが、クローズドなコミュニケーションツールなど、様々なコミュニケーションツールが登場しては消えていく運命にあります。それらを自分の生活と当てはめて、リスクを見極めつつ上手に付き合っていく必要があるんじゃないかと思っています。

LINEも登場した当時、電話帳データを一斉にアップロードする機能があり、非常に抵抗感がありました。一方で周りを見てみると、そういうリスクを認知していなかったり、アップロードした後で気づいて困ったり、ということもあったのですよね。そういう意味で、ツールやサービスを見極める「リテラシー」は一層求められていくんだと思っています。

 

お盆も終わり、何か気分を一新しなきゃなって思い始めています。そろそろ頑張るかー。

スマートハウスはいろんな企業にとってビジネスチャンスになる

日経トレンディの最新号が、日用品・文房具のグッズ特集でした。

 

おしゃれなグッズがたくさん紹介されていて、眺めるだけでもテンションが上がる感じでしたが、家電系も結構あり、今後のITトレンドを象徴してるなって思いました。

例えば、家にあるリモコンをスマートフォンに統合しちゃうIRKitとか。

 

温度や湿度、CO2濃度などを計測して、スマートフォンに表示してくれる装置とか。

 

スマートフォンで電球のOn/Offや明るさ、色を変えられるやつとか。

 

 

スマートハウスが今後のITトレンドのひとつ

リビングなどにある従来の家電とITが結びついて、新しい価値を生み出すという流れが生まれています。上記の商品などはその例です。いずれも、センサーを装置に組み込んだり、別途スマートフォン用のソフトウェアを提供しています。

家の中でWi-Fiなどのネットワーク環境が整備され、安価なセンサーやスマートフォンが普及してきたことで、実用性が出てきました。いろんなアイデアあふれる商品はこれからも登場してくるでしょう。電気や水道の使用量、テレビの利用時間、留守時の温度・湿度など、家の中にあるデータでうまく計測できていないものはたくさんあります。これらが計測され、スマートフォンなどで効率的に閲覧・管理できるようになると、効果的な節電や留守中のペットの様子など、新しい生活パターンを生み出すことができるようになるでしょう。

 

プライバシーデータを提供することでメリットが生まれる

今、「自分でつくるセーフティネット: 生存戦略としてのIT入門」という本を読んでいますが、その中で「総透明社会」という言葉が出てきます。ECショップやSNSが普及したことで、プライバシーに関する情報がネットに(意図する・しないにかかわらず)提供されることになり、いろんなことが「透明」な社会が生まれている、という意味です。

確かに個人に関するデータは以前よりもどんどん表に出るようになっています。一方で、そのメリットも享受しているわけです。アマゾンであれば、おすすめ商品をリコメンドしてくれますし。

そして、スマートハウスとして家の中にあるデータが、いろんな機器やサービスを経由して企業に渡ることで、同じようにビジネスに利用されることになると予想されます。企業にとっては新しいビジネスチャンスがあるでしょう。生活パターンが分かれば、いろんな新しい提案ができるからです。

また、個人が身に付けるウェアラブルデバイスから得られるデータを、会社が従業員の健康管理に活かせるという記事もありましたが、そうやって各個人の生活に関するデータは、企業にとっていろんな点で活かせるポイントが生まれてくるでしょう。

Using Wearable Devices to Help Promote Employee Wellness | Entrepreneur.com

 

というわけで、いろんな家電を使ってみたいなーと思いました。今後も様々な家庭用デバイスが登場するでしょうし、家ごと提案する企業も登場してくるかもしれません。楽しみです。新しいビジネスチャンスは、この領域にも転がってると思います。

ウェアラブルデバイス「Jawbone UP24」を買ったら生活が激変した

ウェアラブルを体感するために、Jawbone UP24という活動量計リストバンドを購入しました。身につけて数日経ったのですが、少なくとも生活に変化をもたらす力があることを実感できました。

 

 

良く歩き、良く眠るようになる

UP24は、日々の活動量と睡眠を計測することができます。それ以外にも、他のアプリと連携したり、食事の記録もできるのですが、食事は記録が面倒で使っていません。このあたりは、写真撮ったらカロリー計算してくれるっていうぐらい手軽さがないと万人向けとは言えないかもしれないですね。

で、活動量がわかるので、「もう少し歩こう」という気持ちを起こさせてくれます。「腕につけて正確に歩数をカウントできるのか?」という疑問もあるかもしれませんが、体感的にはそこそこ正確な気がします。細かいことは気にしません。

また、睡眠を記録してくれるのもいろいろわかるので楽しいです。以下はある日の睡眠記録ですが、早く寝ても意外に眠りが浅く、深く眠れてる時間は少ないのがわかります。

up24

こういうのを目にすると、睡眠の質を上げるにはどうすればいいんだろうなって考えるようになりますよね。

加えて、「スマートアラーム機能」が素晴らしいです。個人的には、この機能が一番買ってよかったと思える点ですね。「スマートアラーム機能」は、起きたい時間帯の中で眠りが浅いタイミングを感知して起こしてくれる機能です。これが、とても目覚めを気持ちよくしてくれるんですよね。自分でも驚くほどの効果です。

買う前は、このあたりのレビュー記事を参考にさせてもらいました。

Jawbone UP / UP24レビュー:通知&アドバイスで活動促進するリストバンド – Engadget Japanese
Jawboneの『UP24』を使ってワイヤレス同期の便利さを実感 – 週アスPLUS
Jawbone UP24を一ヶ月間使ってみてのレビュー – シンプルライフ

 

UP24は他の健康系アプリと連携できるプラットフォーム

UP24のアプリは、単にバンドで計測したデータを見るだけでなく、他のアプリと連携して統合的に健康系データを管理することができます。

まず、IFTTTでいろんなデータを取り込んだり送ったりできます。

IFTTT 2.2(無料)
カテゴリ: 仕事効率化, ユーティリティ
販売元: IFTTT – IFTTT Inc(サイズ: 26 MB)
全てのバージョンの評価: (182件の評価)
iPhone/iPadの両方に対応

天気をIFTTTに表示させたり、Googleスプレッドシートに日々の睡眠や活動の結果を記録したり。

とりあえずUP24と連携させたiftttのレシピ3つ | Punksteady

 

また、Runkeeperと連携すれば、ランニングやサイクリングの結果も取り込むことができます。

RunKeeper ランニングもウォーキングも GPS 追跡 4.7.1(無料)
カテゴリ: ヘルスケア/フィットネス, スポーツ
販売元: FitnessKeeper, Inc. – RunKeeper, LLC(サイズ: 32 MB)
全てのバージョンの評価: (1,949件の評価)

走ったルートが地図で表示されますし、運動結果をUP24に統合することが可能です。ちなみに、知らない間にデータが公開になっていないか、注意。公開したくない人は、最初にオプションでデータを公開しないように設定しましょう。

 

さらに、体重も記録することが可能です。Withingsで。

Health Mate by Withings – 歩数トラッカーとフィットネスコーチ 2.2.0(無料)
カテゴリ: ヘルスケア/フィットネス, メディカル
販売元: WiThings, S.A.S. – WiThings, S.A.S.(サイズ: 58.5 MB)
全てのバージョンの評価: (89件の評価)

本当は、体重計も買って、体重を計測するだけで自動的にアプリに記録するようにしたいところですが、そのためだけに新しい体重計を買うのもなんだったので、手動で記録してます。十分対応できます。

 

Jawbone UPの機能を使って無料で体重管理をグラフ化するたった1つの方法

 

単なるライフログではなく、行動につなげるサービス

UP24は、健康に関する豆知識などをアプリに表示してくれます。「寝るときにスマートフォン見てると、明るさが眠りの質を悪くするよ」とか、「最近寝る時間が遅くなってるよ」とか、いろいろ注意喚起してくれるんですね。

これが、生活を改善させるきっかけを与えてくれるわけです。

UP24は、これまであったような記録を取るだけのライフログではなく、記録を踏まえて実際の行動を変化させること、継続させることを助けてくれます。日々の記録がモチベーションになり、改善すべきところを見つけ、実践していく。その繰り返しを生活の中に織り込むことができるという点で、有効性を実感できるサービスになっています。

これまでのライフログは、どちらかというと使い方のハードルも高く、アーリーアダプター向けという印象でした。しかし、UP24であればずっと身につけるだけですし、Bluetoothで自動同期するので操作も複雑ではありません。今後はマジョリティへ普及していくでしょう。

ウェアラブルってこういうことなんだなーというのを実感しています。

 

「健康である人は、幸福感や所得が高い」という研究結果があると聞いたことがあります。実際にどうかは知りませんが、UP24を身につけてから早寝・早起きになりましたし、健康が生活のモチベーションを高めている気がしています。

興味がある方はぜひ試してみてください。おすすめです。

 

Bluetoothの新規格で新しいサービスがどんどん登場している

スマートフォンに標準装備されてるBluetoothって、使う機会がないしONにしてると無駄に電力消費するだけだとずっと思っていたんですが、最近2つほどBluetooth接続の機械を買いまして、利用シーンが増えてます。

 

Bluetooth型のヘッドセットです。主にイヤホンとして使ってます。片耳だけで使えますし、充電持ちもそれなりに良いので、移動中に聞くのに重宝してます。

 

ウェアラブルなライフログツールですね。健康を維持させるのに良いかな、と買ってみました。

これらを使いながら思ったんですが、ビッグデータの世界が到来していることを実感しています。ビッグデータでは、主にM2M(機械間の通信)が増えて、データ量が増えていくと言われていたんですが、企業だけでなく個人でもそういう場面が増えてるんだな、と。

 

Bluetooth機器が増えている理由

大きくは、Bluetoothの新しい規格にあると思っています。Bluetooth4.0(Bluetooth LE)と呼ばれる規格は、これまでのBluetooth通信の容量やスピードを向上させたというのではなく、省電力性を重視した内容になっています。なので、パソコンやスマートフォン以外の機器による通信が、頻繁に充電する必要がなくなるなど、実用に耐えられるほど密に行えるようになってきているのです。

以下は2012年の記事ですが、そこからBluetooth4.0に対応した機器が増えてきています。

朝日新聞デジタル:いままでとどう違う? 「Bluetooth 4.0」 – 斎藤・西田のデジタルトレンド・チェック – デジタル

Appleがまもなくスマートウォッチを発表すると言われていますが、そういう機器でも省電力で通信できる環境が整ってきたと言えるでしょう。

ウェアラブルについては、この本が参考になると思います。

 

リビングでもBluetoothなど新しい通信が利用される

AppleTVは、今は無線LANでパソコンなどのデータを表示することになっていますが、Bluetoothへの対応も始まっているようです。

AppleTV Software Update 6.1の新機能「AirPlay device to discover Apple TV over Bluetooth」を試してみた。

あくまでコンテンツをストリーミングするために使えるわけではないですが、無線LAN以外の通信でも利用できることで、利用範囲を広げる意図があるんだと思います。

同じようにChromecastは、Wi-Fiじゃない規格でも通信できるようになる、という話が出ています。

Chromecast、超音波通信でもっと簡単にペアリングできるように : ギズモード・ジャパン

 

企業でも新しい通信を使ったサービスが登場している

Appleは、iOS7からiBeaconという通信技術を搭載しています。中身自体はほぼBluetooth 4.0のようです。

iBeaconとは? | iBeaconなら「ストアビーコン」

これを使うと、店舗への来店時に店にある機器と来店客のスマートフォンを通信させて、クーポンを配布することが可能になります。インターネット回線だと、一度クーポンをダウンロードしてもらって表示するなど、手間がかかりました。iBeaconを使うと、ダイレクトにスマートフォンにクーポンを表示させることができます。しかも、店に近づいたと同時に。

また、決済手段であるPaypalにもBeaconが導入されています。

具体的には、行きつけのカフェに入ると店員から名前で挨拶され、注文しなくてもいつもの商品がテーブルに置かれる。飲み終わると店員に挨拶をして店を出るだけで自動的に決済が完了している、というイメージだ。
米PayPal“支払い方法の未来形”、「PayPal Beacon」を発表 -INTERNET Watch

これらのサービスによって、新しい行動をユーザーに生み出すことができるかもしれません。

それ以外にも、車でも利用が進められようとしています。高機能化する自動車の配線を減らし、スマートフォンなどから制御できるようになるとのことです。

情報系だけでなくLINの置き換えも:Bluetooth LEでクルマが変わる? 関心高まるスマホとの連携 (1/2) – EE Times Japan

 

というわけで、いろいろ新しい通信規格をベースにした新しいサービスが実用レベルを迎えています。M2Mによるビッグデータの世界が訪れているわけです。自分のビジネスや生活に取り込めるようになってますよ!

ベネッセの個人情報流出を自社への教訓とするためのポイント

ベネッセの個人情報流出に関して、いろいろ展開が生まれていますが、きっと、日本全国の企業や組織で「自分たちはベネッセと同じようなリスクはないのか?」と右往左往されているんじゃないかと想像します。

ここまででわかっていることを踏まえ、ポイントを整理しておきたいと思います。

情報流出は、法律で罰するのは難しい

今回の事件で、久々に情報漏洩に関する法律関係の知識を思い出しました。既に犯人が逮捕されていますが、立件は「不正競争防止法」になっています。企業における競争を不正に防止するような行為を行った、ということです。

そもそも情報には所有権がありません。というか、実態がないので所有権を特定することが難しいのです。なので、情報を盗むのは、窃盗などと同じように扱うことが難しくなるのです。余談にはなりますが、ビットコインが革新的だと言われているのは、情報に「所有権」を定義できるからです。

ビットコインなどの仮想通貨はなぜ普及しているのか

不正競争防止法が成立するためには、「秘密管理性」「有用性」「非公知性」の3つを満たす必要がありますが、今回ベネッセが保持する個人情報はそれに該当すると判断されたようです。

【ベネッセ情報漏洩】顧客情報は「営業秘密」 事件化へ要件満たす – MSN産経ニュース

つまり、自社が情報漏洩した場合に犯罪として立件されるためには、これらの要件が満たされるように情報管理しておく必要があります。今回のベネッセの件では、「秘密管理性」を満たすかが一番ポイントになったようです。漏洩を防ぐ仕組みが構築されており、社内で「秘密」として管理されている状況であったと認められたことになります。

人的対策と技術的対策はどこまでやれば良いのだろうか

今回の犯人は、ベネッセの関連会社であり、システム運用管理の中心的存在であったSEとなっています。これで思い出したのが、少し前にあった横浜銀行の事件です。事件は、横浜銀行のシステム運用を担当していた富士通フロンテックの社員が預金者の情報を見てカードを偽造し引き出していた、というものです。

西本逸郎のIT社会サバイバル術横浜銀行のデータ不正取得事件から考える、内部不正事件と標的型攻撃の共通項:ITpro

横浜銀行の場合、暗証番号を見る正当な権限があり、長年担当する中心人物だったようです。

重要な情報を管理する体制として、長年担当し正当な権限を持つ、信頼されている人間が犯行に及ぶようになると、企業は大きなダメージを受けます。属人的な状況を作らない、権限を一人に掌握させないなどの人的対策は重要になるでしょう。

また、不正競争防止法における「秘密管理性」に認定された通り、入退室管理や権限管理、複製防止などの技術的対策は行われていたようです。あえて書きませんが、Twitterでは複製防止をすり抜けてデータを持ち出した方法に関する情報が流れていました。技術的対策には、いたちごっこの面もあります。常に危機感を持ち、技術的対策をアップデートし続ける必要があります。

クライシスマネジメントにおける初動の重要性

企業に危機が生じたとき、その初動はとても重要です。これまでマクドナルドの「顔」だった原田さんが、新しいベネッセの顔として表舞台に立つにしては、相当ヘビーな案件になってしまいました。

個人的には、最初の記者会見で「金銭的補償はしない」と明言されたことに、違和感を覚えました。会見当時、どこまで事実関係を掴んでいたのかはわかりませんが、漏洩したことに間違いはなく、事情はどうあれ「管理体制が甘かったんじゃないの?」という認識を抱かれる可能性は十分にあります。その後の会見では金銭的補償を行う方針に切り替えたことから、その間に危機管理に関する認識を変えたということでしょう。

こういう場合、法的な正統性や専門的見地からの事実とは別で、「一般的な感覚」が重要になります。銀行やクレカなどの直接的に金銭に関する情報は含まれていなかったようですが、ベネッセの扱っている顧客情報には子どもが多く含まれており、家族構成や職業情報など比較的センシティブと思われる情報が対象になっており、心理的には結構な抵抗感があります。そういう意味で、初動における感覚を読み誤った感があります。まあ、結果論になりますが。

クライシスマネジメントでは、初動がその後の企業イメージを大きく左右します。被害者やメディアがどういう感情を抱くかを考慮する必要があります。企業のためと思い保身に走ると、逆効果で大きく企業イメージを毀損することがあるわけです。

以上です。「自分のところは大丈夫」という過信は禁物ですね。

R言語で文字列の類似度を計算する

a1380_001345

ビッグデータによる解析で注目されているのは、文字列解析です。

数値解析はこれまでも行われてきましたが、非定型で定量化されていない文字列のデータをどう解析するかは大きな課題でした。しかし、いろいろ解析手法が編み出されてきており、かつIT技術の進歩によって膨大なデータを取り扱えるようになっていることから、現実的に使える分析になっています。

これまでR言語による分析をはじめたと書いてきましたが、今回は具体的な文字列解析に関する内容を書いておこうと思います。

 

文字列の類似度を定量化する

2つの文字列を比較して、どの程度類似しているかを定量化します。いろいろ手法はあると思っていますが、とりあえず使いやすそうなのは「レーベンシュタイン距離」です。

レーベンシュタイン距離(レーベンシュタインきょり)あるいは編集距離(へんしゅうきょり)は、情報理論において、二つの文字列がどの程度異なっているかを示す数値である。具体的には、文字の挿入や削除、置換によって、一つの文字列を別の文字列に変形するのに必要な手順の最小回数として与えられる。

レーベンシュタイン距離 – Wikipedia

R言語の場合、「MiscPsycho」というパッケージにレーベンシュタイン距離を計算できる関数が用意されています。R言語ってこういうパッケージで簡単に用途を広げられるのが素晴らしいですよね。

aとbの文字列の類似度を計算する場合
library(MiscPsycho)
string(a,b)

 

文字列の全てではなく特定のキーワードを抽出する

文字列の比較を行うにしても、全てを単純に比較するより単語を抽出した方が効果的な場合もあります。そういう場合は、名詞だけを取り出してみましょう。

R言語では、「RMeCab」というパッケージで簡単に名詞などに分解するような、形態素解析を行うことが可能です。

aの文章を形態素解析する場合
library(RMeCab)
result <- RMeCab(a) # 形態素に分解したリストが生成される
unlist(result) # リストを表示

基本的な操作は以下の資料を参考にしました。

 

OsakaR_3: R言語によるテキストマイニング入門 from Yuichiro Kobayashi

 

ちなみに、Macの環境でRMeCabのインストールがうまくいかなかったので、以下のリンクを参考に実施しました。

RMeCab – RとLinuxと…

 

これで、文字列の類似度を比較することもできるし、形態素解析を組み合わせて、比較の精度を向上させることだってできます。しかも、パッケージを2つインストールするだけで、R言語上ですぐに実行できるのだから、本当に良い世の中になったものです。勉強するための資料もインターネット上にたくさん存在しているし。利用しないともったいない。

今度は、株価分析もやろうかなーと思っていますよ。

データ分析したい人は、とりあえずR言語を使ってみよう

a0001_014308

前回の記事で、データアナリティクスを実際にやるためにR言語を学習し始めたと書きました。

「ヤバい予測学」を読んで「R」を学んだら、データアナリティクスの可能性を肌で感じた | Synapse Diary

引き続き、R言語を触っています。やってみて思ったことは、「実際に触っていると、分析の切り口が思い浮かぶ」「やりながら分析方法が改善されていく」ということです。

最初は、「何となくこういうことを分析したい」というところから始まったのですが、少しずつプログラムを組んでいくと、「ここをこうすれば、具体的な分析結果までいけるのでは?」と思いついたり、作ってる途中で「ここを変えれば、もっと良い分析ができるのでは?」と閃いたりします。

 

意思決定に影響を与えるデータ分析を行うために

会社を変える分析の力」では、データサイエンティストに求められる条件は、「どんな分析をするか構想する力」であり、その結果として組織の意思決定に影響を与える必要があると書かれていました。

データ分析が注目されていますが、一番高いハードルが、「結局分析して何の役に立つのか?」という点に応えるための、一連の流れを創りだすことにあります。そのためには、分析ノウハウも当然必要ですが、業務に結びつけるイメージも同時に持つ必要があります。

 

人のタイプにもよると思いますが、個人的にはやはり分析ツールや方法を実際に知らないと、意思決定に結びつけるまでイメージするのは難しいと思います。そして、R言語を弄ぶことで、漠然と描いていた、データ分析から意思決定までの流れが少しずつ具体的にイメージできることを体感しました。

 

データ分析には限界がある

また、R言語を触ってみるとデータ分析には当然ながら限界があることもわかります。ある程度、人手でカバーしたり、完璧をもとめず有用な分析結果を取り出すよう、「割り切る」部分も求められるわけです。

そういうことも含めて、データから良い分析結果を取り出すまでのフローを設計することが、データサイ分析の現場では求められます。

今回、文字列の類似度を計算したり、クラスター分析したりしてみましたが、文字列の類似度も完璧に機械化できるわけではなく、人間の感覚とは違います。また、クラスター分析だっていろんな手法があり、自分がイメージするように綺麗にクラスターとして分けてくれるわけではありません。こういう壁にぶつかるとイライラしてきますが、一定の限界を受け入れなければいけないわけです。

それと同時に、クラスター分析にいろんな手法があり、それを改善する方法もいろんな人が研究してるんだなーと感心もしました。奥が深い、統計分析の世界。。。。

 

まだR言語の書籍買わず、ネットで調べただけですが、フリーツールで、膨大な情報があるというのは、本当にありがたい時代だなって実感します。

Slideshareあたりで参考にした資料を貼っておきます。とりあえずこれらを読めば、いろいろ分析に着手できますよ。

 

 

 

 

 

「ヤバい予測学」を読んで「R」を学んだら、データアナリティクスの可能性を肌で感じた

ビッグデータやデータアナリティクスという言葉が、すっかりバズワードになっている気がしますが、実用的なネタはそれほど多くなかったり、まだ実際の業務で当たり前に使うってレベルではありません。むしろ、これからもっと実用的なレベルになっていくんだと思います。

 

「ヤバい予測学」を読むとデータ分析したくなる

 

「ヤバい予測学」を読んだのですが、予測に必要なアナリティクスのアプローチや実例を、丁寧に順を追って説明してくれます。シンプルな予測モデルの作成にはじまり、複合的な予測モデルの組み合わせによる精度向上、人工知能の実態なども具体的な分析のイメージを与えてくれます。

合わせて述べられる豊富な実例は、自分の業務などにどう活かせるかを考えながら読ませてくれるので、すごい刺激を受けます。

組織的にどうやってデータアナリティクスを導入していくか、という点では「ビッグデータ・アナリティクス時代の日本企業の挑戦」が面白いですが、具体的なデータ予測の中身を学ぶのであれば、「ヤバい予測学」の方が良いです。

 

分析したくなって「R言語」の学習をはじめた

「ヤバい予測学」を読んで、たまらなく分析してみたくなったので、統計解析ソフト「R言語」をインストールして、勉強してみることにしました。

The Comprehensive R Archive Network
[browser-shot url=”http://cran.r-project.org/” width=”600″ height=”450″]

少し触ってみてわかりましたが、基本的な統計分析ができるようになっていますし、数千行にもおよぶデータ群を読み込ませても、ヒストグラムなども簡単に解析できます。複雑な計算でも、スクリプトを書けばできますし、構文もそんな難しくありません。ただ、データモデルはちょっと独特な感じがしますね。

 

いろいろ試行錯誤しながら、文字列の類似度を評価して、クラスター分析してみました。文字列の類似度を計算するメソッドが用意されていることにも、驚きを覚えました。コマンドひとつで実施できるわけですから。

文字列の類似度を測る(1) レーベンシュタイン距離|Colorless Green Ideas

それ以外にも、全然業務に関係ないけど、株価予測とか企業の倒産確率とか面白そうだなーと思ってます。

R言語を用いた自己回帰モデルによる株価予測を試してみた – Yuta.Kikuchiの日記
Rで学ぶ『構造型モデル de 倒産確率推定』

 

知識として理解することも重要だけど、実際に自分で触ってみると「実感」としての理解が進みますよね、やっぱり。データアナリティクスは、改めていろんな可能性が広がってるなって思いました。

しばらく分析ネタに飢えていると思うので、良い分析ネタがあれば、誰か教えてください。

快適に文章を書くためにアウトライナー「WorkFlowy」を使う

少し前から、このブログを書くのに「WorkFlowy」というアウトライナーを使っています。

WorkFlowy – Organize your brain.
[browser-shot url=”https://workflowy.com/” width=”600″ height=”450″]

アウトライナーというのは、その名の通りアウトラインを整理するためのツールです。箇条書きが基本になっていて、インデントによって親子関係を表現したり、順番をドラッグ&ドロップで入れ替えることができます。そんなに凝った機能はなく比較的シンプルがツールです。

今回の記事も最初はアウトライナーに落としてから書きました。(比べればわかりますが、あんまりアウトライナー通りに書いてあるわけじゃありません。。。。)

workflowy

ただ、アウトライナーで書いてみてみると、いろいろメリットがあるのです。

 

文章を構造的に整理することで、様々なメリットがある

これまで、アウトライナーは使っていませんでしたが、何となく項目立てを予め決めて書いたりしていました。しかし、アウトライナーを使うと、文章を書くのが楽しくなりました。

 

書きたいメッセージが明確になる

いつも、書こうと思うメッセージが自分の中にはあるはずなんですが、なかなか文章にしていくのは難しいものです。

しかし、アウトライナーを使って構造を整理して俯瞰すると、「いやー結局何が言いたいのかわからないな」ってことに早めに気づくことができます。書いた後で読み返したときにそうなると、結構心理的負担が大きいのですが、早い段階で思えるのは心理的にプラスです。

 

書く気にならないときも、アウトラインを整理すると筆が進む

何となく筆が進まないときっていうのもあるのですが、「とりあえずアウトラインだけでも書いてみるか」って気になります。あと、アウトライナーでひとつのトピックを表示すると、それ以外画面には表示されないので、集中力が増す感じにもなります。

アウトラインを整理することのメリットは、読書猿でも書いていますね。確かに筆が進む実感があります。

書けない時にあなたを助けるアウトライナー・ストーミング 読書猿Classic: between / beyond readers

 

Web、iPhone、Androidなどマルチプラットフォーム対応が良い

以前取り上げたTodoistもそうですが、こういういろんな場面で使うツールはマルチプラットフォームだとストレスなく使うことができます。

タスク管理ツールはToDoistで決まりで良いんじゃないかと | Synapse Diary

アウトライナーって、あまり目新しい機能でもないわけですが、UIやサービス設計を工夫することで、新しい価値を生み出せるという良い例だと思います。

 

空いた時間もiPhoneでアウトラインを整理

これまで、文章を書くときはPCでキーボードに向きわないと無理だったんですが、アウトラインだけならiPhoneでできるようになりました。これは結構大きいですね。実質的に考える時間が増えることになるので。

あと、ネタ帳的な使い方もできます。

 

というわけで、文章を書く人はぜひお試しを。個人的にはもうしばらく使ってみようかなって思うほど、文章を書くのが快適になりました。Evernoteに標準装備とかしてくれれば良いのになーと思うけど。

ちなみに、以下のリンクからWorkFlowyに登録されると、無料アカウントでは250項目に制限されているのが、500項目まで増えます。ついでに、僕も250項目増えます。

WorkFlowy – Organize your brain.