人工知能やディープラーニングの現状を勉強したのですが、
「じゃあ実際どういうことができるの?」ということを知るために、実例が豊富に掲載されている本書を読みました。
結論から言うと、本書の例はいろいろな期待が高まる半面、それなりに限定的であるという印象も持ちました。やはり技術的な制約はまだまだあるのです。
人工知能に関連する技術ロードマップを理解する
人工知能に関連する技術の進展を理解すると、それに関連するビジネス領域や進化のスピードがわかるでしょう。
ベースとなる技術発展は2012年の(1) 画像認識に始まり、(2) マルチモーダルな認識、(3) ロボティクス、(4) インタラクション、 (5) シンボルグラウンディング、(6)知識獲得と進む。
以下も本書の内容を加工したものです。
段階 | できること | 活用例 |
---|---|---|
画像認識 | 画像認識の精度向上 | 画像による診断 広告 |
マルチモーダルな認識 | 行動予測 異常検知 | 防犯・監視 セキュリティ マーケティング |
ロボティクス | 環境変化にロバストな自律的行動 | 自動運転 物流 農業の自動化 製造装置の効率化 |
インタラクション | 文脈にあわせた環境認識・行動 「優しく触る」技術 | 家事・介護 他者理解 感情労働の代替 試行錯誤の自動化 |
シンボルグラウンディング | 言語理解 | 翻訳 海外向けEC |
知識獲得 | 大規模知識理解 | 教育 秘書 ホワイトカラー支援 |
(1)画像認識のブレークスルーが2012年頃に起こり、今は(2)マルチモーダルな認識のフェーズととらえられるようです。マルチモーダルとは、複数のセンサー情報を組み合わせた環境認識のことですね。そしてこれからはロボティクスが進展していきます。これを見ると、人工知能がまだ万能になるにも時間がありますし、ほんとにどこまで汎用的にビジネスや生活に適用されるのかはわかりません。
AIをどの領域に使えばよいか
様々な事例を見ると、アイデアが浮かんできますが、やはり向いてる/向いていないという領域があります。
画像を用いた事例が多い
事例では、やはり画像を使った例がたくさん登場します。それ以外にも、音声やテキスト解析など、様々な用途はあるわけですが、相対的には画像が多い印象でした。
それは、ディープラーニング技術の多くは、データを大量に獲得する必要があるからです。そうなると、自社で画像を持っていたり、集めやすいという点から、画像を用いた事例が多くなっていると思われます。
ということで、データの収集にはグローバルプレイヤーが以前から注力していて、画像データや音声データを豊富に持つGoogleやFacebookが先行しています。そうなると、それ以外のプレイヤーは勝てないのか?という話になりますが、本書では、その点についてこう書かれています。
ただ留意すべきは、「データは(最も集めた企業が勝つ)一強になりやすい。国内で広げてもグローバルプレーヤーに負けてしまう」(松尾氏)点 だ。松尾氏は、データを基に付加価値を創造する上で、「言語、文化、リア ルなモノや現場などデータ以外の要素を組み合わせるといい」と助言する。 物流や米ウーバー・テクノロジーズのような自動車配車サービスであれば、 現在はドライバーの質が重要な資産となる。グローバルプレーヤーがデータ だけで勝てる市場ではない。
つまり、データの多さだけでは他のプレイヤーに勝てないのであれば、それ以外の掛け合わせを考えましょう、ということですね。
分析結果に説明が求められない(=結果を人間が見ればわかる)領域が良い
もうひとつ注目すべきなのは、こちらですね。
Connectome.designの佐藤氏も、まだAI導入を検討すべきではない領域 として「説明が求められるプロジェクト」を挙げる。「なぜ、この結果を導き出したのか」をAIで解説することは、技術的に難しい。その理由は、 「AIのブラックボックス化」だ。Aーの精度が高度化するほど、アルゴリ ズムは複雑になる。その結果、「何を基準に、どのようなアルゴリズムを 使って答えを導き出したか」が説明できないのだ。
AIは分析手法が複雑になっているが故に、「なぜこの結果になったのか」を説明することができません。なので、画像など「ちゃんと分類できてるね」と結果だけみれば一目瞭然の場合は、活用しやすいということです。
逆に、何らかの予測など結果だけみても、「なぜこうなるのか?」という問いに答えられない領域は、ディープラーニングでは計算はできても、ビジネスで活用するのは難しいでしょう。
今の人工知能にはそれなりに制約があると冒頭に書きましたが、それでも改めてこれだけ豊富な事例に目を通すと、いろいろ活用のポイントが想像できるので、読んでいて楽しかったです。技術の進歩はすごいですね。