Main

株式会社三井物産戦略研究所

米国で始動したAI対話型サービス

2017年3月8日


米国三井物産
新産業・技術室
伊達貴彦


Main Contents

AI対話型サービスとは

米国では2015年にミレニアル世代(1982-2004年生まれ)がベビーブーマー世代(1946-1964年生まれ)の人口を抜いて最大構成となり、その台頭が目立ち始めている。“デジタルネイティブ”ともいわれるミレニアル世代(約7,500万人)は、80%超はスマートフォンと一緒に寝起きする、70%超はスマートフォンを利用してモノやサービスを購入する、1日のうち約1.8時間をSNS(ソーシャル・ネットワーキング・サービス)に費やすなどといわれており、スマートフォンを基軸とした生活を送り、IT等の技術に精通している特徴が挙げられる。近年、このミレニアル世代の取り込みが各業界の重要な攻め筋となり、例えば大手投資銀行のゴールドマン・サックスはCEO自ら、その重要性に言及し、いち早くフィンテック(金融×技術)分野に注力するなど、動き出している。
この社会変化に呼応して、最近登場したのがAI対話型サービスやそれを支える音声認識技術である。ミレニアル世代はコミュニケーションツールとしてメールよりもチャットやSNSを多用し、タイピングでの文字入力が非効率と感じるようになっているが、音声認識技術は、面倒な操作や指示という目に見えないバリアを容易に取り払うことが可能だ。Android搭載スマートフォンではGoogle検索の約20%が音声入力で行われており、Appleのスマートフォンでは週20億回の操作が音声で指示されている。この発展型として、スマートフォンを介した対話(チャット)形式でのモノの注文、銀行口座の残高確認、ホテルの予約、レシピの検索等々を行うサービスが登場し、対話(チャット)相手はクラウド・コンピューター上に存在するAIロボットであることから、「チャットボット」と呼ばれている。
また、Amazonの音声認識技術(Alexa)を搭載したスピーカー型アシスタント端末(Amazon Echo)も急速に普及しており、2017年1月末までに820万台が販売され、米国全世帯の7%が所有したことになる。音声認識技術はAIの一領域であるディープラーニングにより飛躍的に進化しており、2016年10月、Microsoftは、その技術はプロの口述筆記者のレベルに達したと発表した。主要各社の音声認識技術は表のとおりである。
現在のキーボードの原型は1872年に誕生したものだが、音声認識技術の進化により145年の歴史を持つキーボードが消える可能性がある。有線電話がワイヤレスの携帯電話に、銀塩フィルムカメラがデジタルカメラに置き換わったように、不要なインターフェースは取り除かれる運命にある。もちろん、全てのキーボードがなくなるわけではないが、利用シーンは激減すると考えるべきだろう。

AI対話型サービスの萌芽

AI対話型サービスで注目すべき潮流として、Facebookの動きを見逃してはならない。同社は2016年4月、開発者向けカンファレンス「F8」でチャットボットのプラットフォーム構想を発表した。要約すると同社のチャットアプリであるFacebook Messengerをチャットボットが作動できるように改良し、開発者約3万4千人にチャットボットを利用したサービスの制作を促し、Facebookユーザー10億人が利用できるようにする構想である。発表からわずか12週間で1万以上のチャットボットが誕生し、その種別は食、旅行、金融、健康、ニュース、スポーツ等、多岐にわたっている。例えば食であれば、宅配ピザ大手が開発したものは、チャットボットと対話しながらピザの種類を絞り込み、数量を決め、スマートフォンの位置データや事前に登録した住所へ配達、支払いまで完結できる。これにより電話やウェブサイト経由の注文よりも短時間で完結し、かつ、注文間違いが起こりにくくなる。注文履歴を記憶しているため、初めにお薦めの品を提示するなど、カスタマイズもされている。また、スーパーマーケットのチャットボットでは購入する食材に合ったレシピを教えてくれるものもある。スマートフォンを使ったレシピ検索はスーパーマーケット内で行われているという統計データに着目したもので、仮に“トマト、ラディッシュ、鶏肉”と音声入力すれば、関連するレシピをチャットボットが教えてくれるものだ。旅行ではフライトのステータス確認、座席変更、チェックイン等、チャットボットとの対話形式により従前よりもスムーズになるだろう。もちろん、従来の電話窓口、ウェブサイトでもこのような手続きは可能であるが手間や時間がかかるため、リアルタイム性や利便性を求める傾向が強いミレニアル世代は不満を持っている。B to Cだけではなく、コールセンターへの適用等、B to Bの領域にも間違いなく影響を及ぼすだろう。
チャットボットは日を追うごとに進化しており、これからの1、2年で多くのチャットボットが利用されることが予想される。また、スマートフォンのアプリと違い、チャットボットはクラウド・コンピューターに存在するため、スマートフォンにダウンロードする必要がないことも大きな利点である。
Amazonの動きも忘れてはならない。同社の音声認識技術(Alexa)は前述したAmazon Echoだけにとどまらず、さまざまな製品に用いられようとしている。2017年1月末時点で既に2,200ものAlexa搭載デバイスが発表されている。筆者が視察したCES 2017(毎年1月上旬に米ラスベガスで開催される世界最大の家電見本市)ではVW、Ford、Hyundai、LG、Whirlpool等、自動車から家電までAlexaが組み込まれていた。例えば、運転中にワイパーの劣化に気付いたら、また、週末、スキーへ行くため、チェーンを購入したいと思ったら、その場でリアルタイムに注文が可能となる。車の型式により適合するワイパーやチェーンの種別は異なるが、Amazonのアカウントに車の型式を登録しておけば、それに合った商品が発注されるというコンセプトだ。また、帰宅時に立ち寄り先がある場合(クリーニング店や花屋等)、それを思い出した時に、Alexa経由で車に記憶させておくなど、Alexaを介してシームレスに情報をつなぐことができるようになる。米国は車社会であるため、車にコンシェルジュ的な機能を持たせることは理想的である。

何が起ころうとしているのか

プラットフォームビジネスはさらに強靭になるだろう。例えば、AmazonのAlexaが車や冷蔵庫等、さまざまな製品に組み込まれると、オンラインでの買い物は必然的にAmazonのサイトと結び付くことになる。2017年初めに米小売り老舗大手のMacy'sやSearsが大規模な閉店計画を発表したばかりだが、さらにそれを加速させる可能性は高い。また、AmazonやGoogle等のプラットフォーマーの支配力が増すと考えられる。それらのアカウントを持っているだけでさまざまなモノの検索、予約、注文、決済が完結できるようになる。米国ではオンラインショッピングは10%のシェアで、残りの90%はリアル店舗が占めている。生鮮食品等は近所のリアル店舗で買うためだ。そこでAmazonは2016年12月にリアル店舗を立ち上げ、実証実験を開始した。将来、アカウント情報を有効利用することで、注文の品物がオンライン、リアル店舗のどちらから配達されてくるのか気にならなくなり、さらには既存のリアル店舗がAmazonに与することもあるだろう。
また、「音声に値段が付く」ことも考えられる。現在、Google等の検索結果の上位に表示される会社や店は広告料を支払っているが、今後は音声で読み上げた回数で広告料を課金するようになるだろう。音声の場合、パソコンやスマートフォンでの表示と違い、一度に多くを回答できない。よって、初めに読み上げられる会社等は高いプレミアムを持つことになる。「近所で木曜日に開店しているフレンチレストランを予約したい」とAI対話型サービスで聞いた場合、初めに読み上げられるレストランはアクセスされやすくなるためだ。何気なくAIやロボットと対話している裏側で広告ビジネスが動く世の中になっていても不思議でない。

モノ・サービスの在り方が変わる

AI対話型サービスや音声認識技術に最も注力している企業はGoogle、Apple、Amazon、Facebook、Microsoftの5社といえるが、世界の企業時価総額の上位6社に全て名を連ねている(残り1社はBerkshire Hathaway)。共通点は米国企業であり、ITを主とする技術系で、西海岸に本社を構え、近年はAIにより産業の壁を超えてビジネス進出しようと試みていることである。多くの自動車メーカーは、この5社のどこか1社と提携済み、あるいは提携検討中であり、これは5年前では想像できなかったことである。AI対話型サービスそのものは自動車とは無関係であるが、将来、自動車の優位性に寄与する鍵となるためだ。
AI対話型サービスは「人」と「モノ・サービス」を接近させる力を備えている。その接近を「人と人同様の関係」への進展の第一歩と捉えるのであれば、次はモノ・サービスが人の気持ちや感情を読み取り、自発的に話しかけてくると考えるべきである。AI対話型サービスは受け身であったモノ・サービスの在り方を根本的に変える力を持ち、全産業に大きなインパクトを及ぼすことは間違いない。

Information