Main

株式会社三井物産戦略研究所

AIで進化するUIとそのビジネス応用可能性

2018年4月23日


三井物産戦略研究所
デジタルイノベーション室
難波田康治


Main Contents

深層学習の登場によるUIの進化

altテキスト

2012年に画像認識に関する国際学会で開催された画像認識コンテストで、深層学習(Deep Learning)方式を用いたトロント大学のヒントン教授らのチームが、従来の機械学習手法を用いた他チームの認識精度を大きく上回り優勝した。深層学習とは大量の学習データを使ってニューラルネットワークを学習させることにより、アルゴリズムを自動で生成する手法である。これが契機となり、深層学習のさまざまな領域への適用が進展し、画像認識、音声認識、自然言語処理、感情認識(画像、音声)、行動認識といったさまざまな認識技術が飛躍的に性能向上した。また、これらの技術を組み合わせることにより、Chatbot、音声UI、AR/MR(Augmented Reality/Mixed Reality)、ジェスチャー入力といったさまざまなUI(User Interface: ユーザーがシステムとやり取りをする界面における手法、図表1)の実用化が進展しつつある。これらは旧来のUIよりもシステムとのやり取りがより自然であり、あたかも人間とコミュニケーションするかのようなやり取りが可能となる。このため、これらのUIを大別してNUI(Natural User Interface)と呼ぶこともある。後述するようにChatbotおよび音声UIは各種のサービスにおいて実用化が進んでおり、AR/MRおよびジェスチャー入力は今後、実用化の段階に進んでいく見込みである。

またGoogle、IBM、MicrosoftをはじめとするITベンダーが提供するWeb APIにより、Chatbotや音声UIといった新規UIが比較的簡易に自社のサービスに実装できるようになってきている。Web APIとは、各社がクラウド上で提供するサービスであり、Web上で簡単なコマンドを送ることによりAIをはじめとするさまざまな機能、サービスを使用できる仕組みである。これらを用いることにより、システム開発者は独自のAIを一から開発することなく、Chatbotや音声UIといった新規UIを商品・サービスに活用することができる。

新しいUIとその動向

(1)Chatbot

Chatbotは、自然言語処理技術を用いたテキストの解析・生成により、Q&A形式であたかも会話するような感覚で人とシステムとがコミュニケーション可能なUIである。ITベンダー各社からChatbotのソリューションが提供されているが、IBMがWatsonの機能として提供しているのがその代表例である。従来、ウェブサイトでのユーザーサポートはフォームへの入力、Eメール、電話等によるものが一般的だったが、Chatbotの導入で、ユーザーはリアルタイムにシステムと対話することにより問題を解決することができる。現在、ECや金融機関のサイトに幅広く採用されている。

(2)音声UI

altテキスト

音声UIは、マイクから取得した音声を音声認識によりテキスト化し、さらに自然言語処理技術を用いてその意味を解析し、その内容に対しスピーカーを通して応答するUIである。代表例として、Amazonが2014年11月に発売したAIスピーカーAmazon Echoに搭載された音声アシスタント技術「Alexa」があり、現在急速な普及を見せている。Alexaでは音声UIを用いて、音楽の再生、スケジュールの管理、買い物、ニュース・天気情報の提供など、さまざまなタスクの実行が可能である。Amazon Echoはオープンプラットフォームであり、各社はEchoを活用するためのアプリを自由に開発することができる。これらのアプリは「スキル」とも呼ばれ、各社がさまざまなスキルをリリースしている(図表2)。またAmazonはAIスピーカー以外へのAlexaのライセンス供与を積極的に進めている。最も採用が進んでいるのが自動車であり、VolkswagenやFordなどが自社の自動車の音声UIとして採用を発表しており、今後Alexaを搭載した自動車が市場に投入される予定である。

(3)AR/MR

altテキスト
altテキスト

ARは、現実世界の画像に情報を付加して表示するUIであり、MRは現実世界と仮想世界(Cyber World)を結合して表示するUIである。これらは仮想世界が重要性を増すなか、現在注目が集まっている領域である。AR/MRは高解像度な画像の画像認識および画像処理を高速に行う必要があるため、通信の帯域・遅延・コスト等の制約からWeb APIでの提供は現状では困難であり、GoogleおよびAppleはスマートフォン上のソフトウエア開発キット(SDK: Software Development Kit)という形でリリースしている。SDKとはアプリを簡易に開発できるような開発環境のことであり、これを活用することによりシステム開発者はAR技術を活用したアプリを比較的短期間で開発することが可能となる。これらのAR技術はスマートフォンのカメラを利用しており、スマートフォンをかざすと目の前に見えている現実世界に仮想世界を重畳して描画することが可能となる。これにより、自宅の部屋に任意の家具を置いて大きさやデザインを検討したり(図表3)、画像認識により特定した店舗内での位置にガイド情報を重畳することにより、店舗内で所望の商品までの道順や詳細な場所をガイドしたりすることができるようになる(図表4)。今後このようなサービスが各社より続々と登場する見込みである。

(4)ジェスチャー入力

ジェスチャー入力は画像認識や行動認識技術を用いて、ユーザーの手や視線などの動作を検出することにより、システムへの入力を可能とするUIである。テレビやスマートウォッチの操作など、声を発しにくいシーンにおいて利用するUIとして、注目を集めている。Samsungは特定の手の動きでチャンネル切り替えや音量変更などの操作が可能なテレビを販売している。また、Googleはスマートウォッチ向けOS「Android Wear」に腕の振り方で操作が可能なジェスチャー入力の機能を追加するなど、対応を進めている。

新しいUIがビジネスに与える影響

altテキスト
altテキスト

これら新規UIの登場は、さまざまなビジネスに大きな影響を与える可能性がある。タッチパネルによる操作というUIを採用したスマートフォンの登場により、地図や写真などが大画面で快適に操作・閲覧できるようになり、従来の携帯電話と比較して用途も大きく広がった。また、より直観的な操作が可能となったため子供や年配者も使えるようになり、サービスの対象者自体も拡大している。このUIにいち早く自社のサービスを最適化させたUber、LINE、メルカリなどがスマートフォンの普及とともに大きくビジネスを伸ばしたように、UIの変化・進化への最適化というのは既存ビジネスのプレイヤーにとって破壊的な影響を与えていくと考えられる。例えば、音声UIが普及することにより、現在スマートフォン上での注文が主流となっているECも、今後リビングルームが主戦場になっていく可能性がある。音声UIで優位に立っているAmazonは引き続きEC市場での勝者になると思われるが、AIスピーカーでシェアを伸ばしているGoogleもAIスピーカーをてこにEC市場でAmazonに続くメジャープレーヤーになっていく可能性が高い。また音声UIの登場は自動車におけるインフォテインメント(情報+娯楽)の仕組みを大きく変えるであろう。従来自動車メーカーが主導してきたインフォテインメントのビジネスを、AmazonやGoogleが主導する可能性もある。つまり音声UIやAR/MRといった新しいUIの登場は、既存のビジネスの枠組みに変化をもたらし、新しいビジネスやプレイヤーが登場する契機となる可能性が高い。

またこれらのUIを活用することにより、会話(テキスト、音声)データや屋内の画像データといった、従来では入手が困難であったデータが集まるようになる。以下に先行するAmazonとGoogleの事例を紹介する。

Amazonは音声UIで他社に大きく先行し、Echoシリーズにより、リビングルームの音声データの取得を進めている。従来のAmazonのECでは家族の買い物を一つのアカウントで済ませている場合も多く、一人一人のデータを区別することが困難であったが、Amazon Echoの米国版は2017年10月より話者認識に対応し、個人のデータの取得が可能となった。これにより、よりきめ細やかなマーケティングやターゲティング広告が可能となるため、Amazonは近年広告ビジネスに注力しており、市場調査会社eMarketerによれば2017年の広告関連の売り上げは前年比48%増の16.5億ドルに達すると予測している。

Googleはスマートフォン用OSのAndroidという強力なプラットフォームを持つが、Amazonが先行する音声UIでも巻き返しを図っている。2017年夏にリリースされたAIスピーカー「Google Home」は、調査会社によるベンチマークでも多くの機能でAmazonを上回っており(図表5)、AIスピーカーにおけるシェアも2017年現在、全世界で15%、米国では31%を獲得している(図表6)。また、AR技術を利用したサービスの立ち上げにも力を入れており、屋内でのナビや店舗での商品ガイドなどのサービスを提供するために屋内画像データを収集するなど準備を進めている。ARを利用するユーザーが増加すれば、将来的には屋内や商品の画像を大量に収集できるようになる見込みである。

 

今後の展望

altテキスト

AIの活用によるUIの進化は今後も続く見込みであり、Web APIやSDKの活用によりこれらが比較的簡易に実装できるようになってきている。これらを活用することにより、従来では困難であった、より直観的でユーザーにとって使いやすい新たなサービスが実現可能となる。これにより、商品やサービスの形態、およびビジネスにおけるプレイヤーが大きく変貌する可能性がある。加えて音声UIの場合、手による入力や目による確認が不要となるため、自動車、自転車、スポーツ等の領域でこれを活用した新たな商品・サービスが登場し、新しい市場が形成される可能性が高い。また副次的効果として、会話(テキスト、音声)データや屋内の画像データといった、従来では入手が困難であったデータが集まるようになる。2009年頃から始まったスマートフォンの普及によって集まるようになったデータを、自社のサービスで収集しマネタイズした事例として、NTTドコモが自社のユーザーから取得した位置情報を基に、タクシーの需要予測をするサービスを2017年より提供開始した例がある。またTwitter, Inc.は自社のSNSのデータの検索サービスを有料で提供しており、このデータライセンスビジネスは広告に続く第2の収入源となっている(図表7)。2017年には広告収入が落ち込んだが、データライセンスビジネスは好調であり、Twitter, Inc.は創業以来初の黒字化を達成した。このように自社で収集したデータを基に新たなサービスを開始し、マネタイズしていくという事例が今後新規UIを活用したサービスでも増えていくであろう。

しかしながら、魅力的なサービスを立ち上げ、ユーザーを囲い込み、ユーザーから取得したデータを利用し、マネタイズするところまでには、長い時間を必要とするケースも多い。NTTドコモの例では、スマートフォンの本格的な普及からタクシーの需要予測のビジネス化までに約8年を要している。またTwitter, Inc.の例でも、2010年の本格的なサービス開始から2017年の黒字化まで約7年を要している。長期的な視点を持ちつつ、いち早く新規UIに最適化したサービスを開始し、ユーザーを囲い込んでいくことが求められている。これにより、将来的にはユーザーデータの利活用による新たなビジネスを創出できる可能性が高まる。なお、近年プライバシーへの意識の高まりやEUにおける一般データ保護規則(General Data Protection Regulation: GDPR)に代表される当局によるプライバシー関連の規制強化の動きもあり、これらに留意しながらビジネスの創出を検討していく必要がある。

Information


レポート一覧に戻る