見出し画像

Facebookのメッセンジャープラットフォームの本当の狙いは正しく報道されていないと(僕は)思う。

(今回は完全に主観なので「オレ(私)は違うと思う」という方もいらっしゃるかもしれませんが、悪しからず。)

さて、LINEに続き、Facebookもボットプラットフォームをリリースして、盛り上がっていますね。「F8カンファレンス:FacebookがMessengerのチャットボットのプラットフォームを発表」が詳しいので詳細はこちらをご覧ください。

がしかし、Facebookが本当に何を狙っているのか、というのが正しく報道されていない気がするので、僕の解釈を書いておこうと思います。(繰り返しますが、あくまで主観です。)


メッセンジャープラットフォームにおける3つのリリース

今回、f8カンファレンスで発表されたメッセンジャー関連の内容は、大きく分けて3つに分類できる。

#1: ビジネスアカウントにもメッセンジャーを開放
#2: メッセージを送受信するAPIを開放
#3: メッセージを自動で送受信できる人工知能プラットフォームを開放(ボットエンジン)

「#1: ビジネスアカウントにもメッセンジャーを開放」では、これまでユーザー同士(C2C)が主だったメッセンジャーを、企業にも開放するという流れだ。これだけだと、企業は「人力」でメッセージをやり取りする必要がある。

「#2: メッセージを送受信するAPIを開放」があると、ある程度、事前にルールベースで定型化できるやり取りは、(人力を介さず)機械的に行えるようになる。他方、全ての「会話」が定型化できるはずもないので、ここは(初歩的な)アルゴリズムと人力のハイブリッドだ。

「#3: メッセージを自動で送受信できる人工知能プラットフォームを開放(ボットエンジン)」が本当に実現すれば、ほぼ全てのメッセージのやり取りが機械(人工知能)が処理できるようになる。


報道を見ると「#2: メッセージを送受信するAPIを開放」と「#3: メッセージを自動で送受信できる人工知能プラットフォームを開放」ばかりに注目されていますが、圧倒的に「#1: ビジネスアカウントにもメッセンジャーを開放」のインパクトが大きいと思います、ハイ!


「#1: ビジネスアカウントにもメッセンジャーを開放」のインパクトが最も大きい理由

LINEやFacebookメッセンジャーといった「メッセンジャー」はスマホの中でも最も利用回数が多いアプリであることは皆さんご存知だと思う。いわば、メッセンジャーアプリは(最も人通りが多い)「銀座の一等地」のようなものだ。他方、メッセンジャーアプリは、これまで主にユーザー同士のやり取り(C2C)にしか使われてこなかった。

その「銀座の一等地」をビジネスにも開放した、というのが最大の意義だと僕は思う。「フェイスブック「ビジネスアカウント」開放へ 本日F8で発表」という記事が一番的確にポイントを捉えていると思うので引用する。

フェイスブックは昨年、ウーバーの配車をメッセンジャー経由で依頼可能にし、先日はKLMオランダ航空と提携し、搭乗券の受け取りにメッセンジャーを利用可能にした。既に二十数社がビジネスアカウントを設けているが、今回のF8でさらに広範囲の業種からの参入が発表される。

つまり、個人的には、チャットAPIを開放したことではなく、ビジネスアカウントでメッセンジャーを利用できるようにしたことの方が圧倒的にインパクトが大きいと思う。そのチャットのやり取りをAPIで自動化できるかどうか、という以上に。

これで何が起こるか。これまで、「銀座の一等地」にお店を構えられなかった中小企業が、5分だけでもいいから「銀座の一等地」に店を出す、というようなことが起こる。

これらの中小企業は、短時間であっても「銀座の一等地」に店を出せるなら、例えどれだけ面倒なやり取り(=人力でのメッセージ返信)が必要であっても、商売が大きくなるなら喜んでやるだろう。

その先に見えるのが、これらの中小企業に対しての広告ビジネスだ。Facebook広告が本当に強いのは、大企業だけではなく、膨大な中小企業から出稿される多種多様な広告と、膨大なユーザーのマッチングに長けているからであり、これまでの広告アルゴリズムという資産がそのまま使えるわけだ。

以上のように考えると、Facebookとしては、

メッセンジャープラットフォーム開放して、ビジネスアカウントでもメッセンジャー使えるようにするから、最初はある程度、人力でメッセージやり取り頑張ってね。(そして、後から広告買ってね)

というのが本音だと思う。短期的には、自動化されたボットでのやり取りがあろうが無かろうが、十分ビジネスとして成立するという世界観を持っているように思える。


「#2: メッセージを送受信するAPIを開放」のインパクトが限定的な理由

メッセージの送受信をAPI経由で機械的に行えるというのは、インパクトがないわけではないが、ビジネスアカウントに対してメッセンジャープラットフォームを開放したことに比べれば、小さいインパクトだろうと思う。

詳しくは後述するが、最先端の人工知能であっても、メッセンジャー上での会話を人工知能が正確に理解するには全く至っていない。そうなると企業が作る「ボット」は、予め決められた「定型のルール」に基いて会話をし、それ以上のことは、裏側で人力で処理するというのが、現時点では現実的だろうと思う。

もちろん、それであっても、これまでに比べれば様々な点で効率化はされるだろうから、企業から見れば「コスト削減」にはなるだろうが、大きなビジネスチャンスが広がるか、と言われればそうではないだろうと思う。


「#3: メッセージを自動で送受信できる人工知能プラットフォームを開放(ボットエンジン)」はまだまだこれから、と思う理由

今回の発表では、メッセージを送受信するSend/Receive APIの他に、「ボットエンジン」も公開された。「ボットエンジン」とは、

ボットエンジンは機械学習を利用している。会話のサンプルを渡すと、同じ質問の様々なバリエーションを扱うことができる。
デベロッパーは時間と共にボットを改善することが可能になり、その可能性は非常に大きい。例えば、ユーザーは映画ボットと対話して、上映時間や評価等について気軽に質問すればいい。コマンドを入力するというより、人間と話すイメージだ。

というもので、要は、大量の会話の記録をFacebookに提供することで、少しずつメッセージに対してボットが回答してくれるようになる、というわけだ。

実際に「ボットエンジン」の元になったwit.ai(Facebookが買収)を試してみた。wit.aiのデモサイトでは、実際のメッセージを入力すると、人工知能がどのようにその会話の意図を把握できるか、が簡単に分かる。

実験1:「Set the alarm for 6am(6amにアラームを設定して)」

こんな具合に、人工知能が正しく理解してくれた。(confidence=0.949と高く、intent=alert_set、datetimeも正しく理解出来ている)


実験2: 「restaurants for dinner tonight(今晩のディナー用のレストラン)」

すると、人工知能は正しく理解できなかった模様。(confidence=0.406と低く、internt=unknown)


実験3: 「birthday gift for my friend(友達の誕生日プレゼント)」

今回も同じく、人工知能は僕が何を欲しているのか全く理解していないようだ。(confidence=0.437と低く、internt=unknown_command)


こんなシンプルな実験しかしていないけど、「人工知能でメッセージのやり取りが自動化できるかも!?」という淡い期待は、少なくても、今すぐは無理そうだ。「ディナー用のレストラン」や「友達の誕生日プレゼント」という非常に日常にありそうなものでさえも認識出来なかった。

Facebookの名誉のために言っておくと、上記の例はほぼ何も学習していない状態での人工知能エンジンの性能実験であり、人工知能の「エンジン」そのものがダメなのではなくて、機械学習に投入する「データ量がまだ十分でない」、というのが最大の原因だとは思う。


まとめ

冒頭で、今回のメッセンジャープラットフォームのリリースには3つが含まれると書いた。

#1: ビジネスアカウントにもメッセンジャーを開放
#2: メッセージを送受信するAPIを開放
#3: メッセージを自動で送受信できる人工知能プラットフォームを開放(ボットエンジン)

「#1: ビジネスアカウントにもメッセンジャーを開放」はあらゆるサイズの企業が、メッセンジャーという超巨大なプラットフォームで、ユーザーとやり取りが出来るようになる、という点で非常に画期的なビジネスチャンスになると思う。ここには数百万〜数千万という単位の企業が参入すると思う。

イメージとしては、楽天・食べログ・SUUMOなどのプラットフォームプレーヤー以外に、楽天に出店している個々の店舗、レストラン、不動産屋などの所謂、「中小企業」がメッセンジャーを使って顧客とやり取りするようになるだろう。

そのうちの一部が「#2: メッセージを送受信するAPIを開放」を使って、ルールベースのボットを作成し、ボット+人力のハイブリッドでコスト削減をしながら、運用を開始するだろう。これだけの「IT投資」ができる企業は限られているため、これを実行するのは、数万から多くて数十万の企業だと思う。

個々の「中小企業」が個別にこれをやるか、というとかなり厳しいと思う。単純なアルゴリズムとは言え、それなりのソフトウェアを作る必要があるし、ソフトウェア以外に膨大なデータベースが必要だからだ。従って、メッセージAPIを利用するのは、楽天・食べログ・SUUMOなどのプラットフォームプレーヤーが中心になると考えられる。

最後に、#2で蓄積したデータを用いて、「#3: メッセージを自動で送受信できる人工知能プラットフォームを開放(ボットエンジン)」で機械学習をして、人工知能を使って、より自動化されたメッセージのやり取りをする企業が現れるはずだ。(今すぐは難しいかもしれないが、いずれは現れるはずだ。)



以上、「ボットなんてあまり関係ないよ」という割と否定的なことを書いたが、中長期的に「ボット」がどの程度実用化されるのか、というのを以下で少し考えてみたので、おまけとして付記。


おまけ1: 「人工知能」は現時点でどこまで賢いのか?

最近は、大企業からスタートアップまで、いろんな会社がいろんな切り口で「人工知能で●●できます」と言う。元・研究者の僕から言わせると「おいおい、そりゃ無理だぜよ」というのがほとんどだ。

元・研究者の端くれとしては、人工知能は発展してほしいし、もっともっと良い意味で、社会の役に立つ技術になって欲しいと心から願っている。他方、できもしないことを「人工知能」というバズワードを使って、課題宣伝する人たちが増えすぎるのは、人工知能バブルを作り出し、それが崩壊した時のダメージまで考えると、決して良いことではないと思っている。

少し脱線するが、人工知能は(まだ)万能じゃない、ということを少し書いておきたいと思う。

ここ1〜2年の間で、人工知能がブームになったきっかけは、機械学習の分野でDeep Learningという技術が確立されたことが主な要因であることは間違いないだろう。

Deep Learningというのは、(少なくてもそれまでの機械学習に比べて)人間の脳に近い「学習」ができるようになった、という点で画期的だ。Deep Learning「以前」の機械学習は、「特徴量」をあらかじめ与える必要があった。

分かりにくいので、具体的な例で説明する。「個人の属性から、その人の年収を推定する」という問題を機械学習で解きたいとする。「属性」というのは、年齢・性別・職業・学歴・居住地・家族構成...などなど複数ある。これらの属性を入力すると、推定年収が出力される、というモデルを作るわけだが、こういった場合、例えば900人分の正解データ(属性と実際の年収)を使って「学習」しモデルを作り、100人分のデータで「実験」する。「実験」データの方も正解(=年収)は分かっているのだが、正解を伏せた状態で、モデルから得られる推定年収と実際の正解年収がどのくらい近いか、というのを測定する。

Deep Learning「以前」の機械学習は、「属性」のうちどれを「特徴量」として使うか、というのを人間(研究者)が決める必要があった。他方、Deep Learningを使えば、それが不要になった、というわけだ。

例えば、「Bくんの年収はいくらくらいだと思う?」と聞く場合、

Bくんの年収を推定してほしいんだけど、Bくんの性別と年齢だけ教えるから、それだけから推定してね

とは言うのがDeep Learning「以前」の機械学習だ。他方、Deep Learningの場合、

Bくんの年収はいくらくらいだと思う?Bくんの属性(年齢・性別・職業・学歴・居住地・家族構成...)のうち重要だと思うものを自分で考えて使って推定してみてね。

ということを機械(人工知能)がやることになる。より人間の脳に近いかたちではあると思う。

Deep Learningによって、人工知能が「人間の脳に近い」形で学習することができるようになったことは間違いないが、まだまだ産まれたての子供のようなものであることも事実だ。

Deep Learningが最初にブレークしたのは、画像認識の分野だ。機械学習における画像認識では、通常、画像(バイナリーデータ)と画像に何が写っているかの正解が与えられ、機械学習をしてモデルを作り、テストデータ(画像データ)を入力して得られる「画像に何が写っているか」と実際の正解を比べてどの程度、機械が正しく画像を認識できているかを試す。

この世界では、ImageNet Large Scale Visual Recognition Challengeと呼ばれる画像認識コンテストが毎年開催されている。Deep Learning「以前」は、上述ような画像認識の機械学習で、誤差が25%程度だった。毎年1%弱ずつ誤差が減るものの、大きく誤差を減らすチームはいなかった。

それが、2012年に開催された同コンテンストで、Deep Learningを発明したチームが圧倒的に誤差を減らしてしまった。それまで25%程度だった誤差を、たった1年で15%程度の誤差まで減らした。それまで毎年「日進月歩」だった改善に比べて、圧倒的な改善幅であったため、世界中の研究者を熱狂させた。

他方、良く考えてみて欲しい。Deep Learningが凄いとは言え、「画像に何が写っているのか」という非常に簡単な問題に対して、未だに15%「も」間違っている。

恐らく人間の2歳程度の子供であっても、(既に知っているものであれば)画像認識での間違いは15%をずっと下回ると思う。誤解を恐れずに言えば、知識の量の影響を除くと、Deep Learningを使った画像認識は、まだ人間の2歳児にも及ばないレベルだと理解するのが正しいと思う。

もちろん、Deep Learningの方が、2歳児よりも優れていることはたくさんある。例えば、2歳児は、記憶できる対象物の量(知識の量)に限界があるが、人工知能ではほぼ無限に何でも記憶できる。あるいは、Alpha Goが碁のチャンピオンを破ったように、機械的なルールに沿って戦うようなケースでは、人工知能が人間を凌駕することは起こりえるというレベルには達している。


おまけ2: Facebookはなぜそれでも今ボットエンジンを公開したのか?

ボットエンジンの話に戻る。ボットエンジンにおいて人工知能が、会話の意図を把握するにはまだ時間がかかりそうだ、ということを感覚的にご理解いただけたと思う。近い将来、必ずできるようになるとは思うが、今すぐ実用的な何かができるか、というとまだだと思う。

メッセンジャーでの短い会話の意図を正確に理解して、人間と同じように返答できる、というのは、人間で言うと3〜4歳児レベルの頭脳が必要だと思われるが、上述のように現時点では(主にまだ機械学習すべきデータ量が足りないため)人工知能が人間と同じレベルに至るには少し時間がかかりそうだ。

現時点では、予め準備したルールに基いて、回答を出し、それでも回答できない場合は、人力でメッセージを返すというのが現実的だ。

では、自動化に向けて、何が足りないか、というと、恐らく一番足りないのは、(正解)データだと思う。大量の正解データさえあれば、かなりの会話が人工知能で理解可能になるはずだ。

Facebookがこのタイミングで、メッセージプラットフォームを開放した理由のもう一つは、この「正解データ」を集めることだと思う。最初は人力でやり取りされるユーザーと企業の会話(正解データ)を、全て彼らのボットエンジンに投入して学習させることで、徐々に人力が人工知能に置き換わっていくのだと思う。

短期的には、メッセージプラットフォームでの広告で稼ぎ、そのお金をボットエンジンに投資していくことで、他のメッセージプラットフォームに追随を許さないところまで引き離すという作戦なのだと思うが、これは短期的な利益と中長期的な成長を両方見据えた非常によく考えられた戦略だなぁと思った。


----------------------------

最近、有料マガジンも始めました。有料マガジンは、1ヶ月あたり4〜8本の有料ノートが追加される予定です。

Facebookページも作りました。こちらを「いいね」すると、新しいnoteをタイムラインで見つけられるようになります。

----------------------------

気に入ってくださった方は、↓から「スキ」「フォロー」してください!

この記事が気に入ったら、サポートをしてみませんか?気軽にクリエイターを支援できます。

note.user.nickname || note.user.urlname

サポートいただくよりも、Amazonで本のレビューを書いていただける方が助かります。↑のリンクより是非レビューをお願いします!

嬉しいです!(文末にある)LINEの友達申請もお願いします!
48
アメリカ・日本のネット企業(上場企業)を中心に、決算情報から読みとれることを書きます。経営者の方はもちろん、出世したいサラリーマンの方、就職活動・転職活動中の方になるべく分かりやすく書きます。

この記事が入っているマガジン

コメント1件

ILSVRCの理解が間違っていて、データーも古いです。人間の誤認識は0%じゃないです。マダガスカルキャットとかベニテングダケとか人間でも答えらえない人が多いもんね。ご参考まで。
コメントを投稿するには、 ログイン または 会員登録 をする必要があります。