1. HOME
  2. サイネージあれこれ
  3. ロボットとの対話は難しい? ロボット(AI)×デジタルサイネージの実例と問題点
2017/04/18

ロボットとの対話は難しい? ロボット(AI)×デジタルサイネージの実例と問題点

サイネージあれこれ
  • facebook
  • B!
  • 0
twitter
LINE
544 views
サイネージ × AI

2015年あたりから街中でロボットをチラホラとみかけるようになりました。

このロボット達は情報提供、観光案内や商品説明などの人に代わって色々な役目を担っています。そう、デジタルサイネージの機能そのものです。ロボットとのやり取り(音声対話をベース)には、人工知能(AI)の技術が応用されています。

人工知能(AI)とサイネージについては、以前に『人工知能(AI) × デジタルサイネージ!その技術と活用方法を紹介!』で紹介しました。今回は、その中でもロボットとデジタルサイネージについての最新技術とその問題点について説明します。

デジタルサイネージに利用される対話ロボットとは?

いまや世界中でロボット(アンドロイド)が開発されていて毎日のようにニュースに取り上げられています。これらのロボットの特徴的な機能は『会話(対話)』(人の言葉を理解し話しができる事)です。一昔前に、対話できる知的なロボットというとソニーのAIBO が有名でした。ただしAIBOは、情報提供、案内、販売促進や広告といった使い方ではなく、あくまでも愛玩ロボット、エンターテイメント向けロボットです。一方で、昨今はサイネージとして利用されている対話ロボットも出てきましたので紹介します。

Softbank社「Pepper」

pepper

恐らく今の日本で一番よく見かけるロボットがSoftbank社の Pepper (Pepper for Biz) です。一度は店舗や交通機関(駅や空港)など、どこかで見かけた事があるのではないでしょうか?Pepperのビジネス向けの機能として、接客・インバウンド対応・受付などがラインナップされていますが、これらはまさにサイネージそのものです。

ロボットをビジネスに導入する、と言うと費用も莫大なのかと想像するかとおもいますが、非常にPepper は安価です。月55,000円 で本体と基本ビジネスプランを利用できます。もちろん、特別なアプリを導入して動かそうとすると追加費用がかかりますが、ロボットも安価でビジネスとして実際に使えるまでになり、すでに2000社以上の企業で利用されているそうです(Softbank社HPより)。

NTT/ヴイストン社「Sota」

sota

Sota」は身長30cmほどの小さなロボットです。身振り手振りができるだけなく、ユーザーの音声を認識、意味理解をして音声合成技術を使い滑らかな日本語を使って対話することができます。これらは、NTTグループの人工知能(AI)技術「corevo™」による技術が支えています。

2016年11月には大阪OCATにて、“NTTグループのAI技術「corevo™」を活用したロボットとデジタルサイネージを組み合わせた観光案内ソリューションの実証実験”(NTT西日本ニュースリリースより)も行われました。ここでは、環境客に対して観光案内の検証をしました。

シャープ社「RoBoHoN」

RoBoHoN

RoBoHon」はシャープが開発したロボット電話です。身長約20cmと非常に小型ですが、音声による対話や二足歩行が可能です。電話、メール、カメラといった携帯電話の基本機能を備えているモバイルロボットで、標準的な機能は対話や検索、画像の表示、会話によるコミュニケーションが出来ます。

加えて、法人向けのサービスも2016年10月から開始しました(『RoBoHoN(ロボホン)』、法人への本格的導入に向け「お仕事パック」の提供と「認定開発パートナー制度」を開始:シャープニュースリリースより)。この「お仕事パック」の中には、受付/積極アプリやプレゼンアプリがあり、お客様の案内や情報発信などサイネージ機能も含まれています。

東芝社「地平ジュンこ」

地平ジュンこ

東芝が開発したコミュニケーションアンドロイド「地平ジュンこ」は、人間らしい容姿で手や腕が人間のように滑らかに動きます。また、顔の表情が変化するだけでなく、独自の音声合成技術を使って日本語・英語・中国語の3カ国語を話すことできます。

アクアシティお台場の観光案内所に「地平ジュンこ」が常設されています。横にある入力端末から言語と聞きたい観光情報(店舗情報、近郊の観光案内、交通案内、国内主要観光地など)を選択すると、指定した音声言語で案内をします。また、店舗の広告宣伝やイベントの紹介などをします。2020年のオリンピック・パラリンピック東京大会に向け増加が見込まれる外国人観光客に対応すべく今後が期待されています。

人工知能(AI)を使った人間型ロボットの実例を幾つかあげましたが、人間の風貌をしていなくても、スマートフォンのサービスでは、DOCOMOのしゃべってコンシェルApple社のSiriといった音声を使ったエージェントサービスが日々進歩しています。

対話ロボットの課題

人間のような滑らかな仕草や感情表現、そして対話ができるロボットに欠点はあるのでしょうか?SF映画のような未来体験がようやく現実に、とワクワクしますが、実際はまだまだ課題が山積みです。

一番の問題は、これらのロボットの特徴である『会話(音声認識や意味理解等)』機能がまだ技術的に完成できていない事です。

音声UI技術の理想と現実

人とロボットの会話を成立させるためには、音声認識が必須の技術です。音声認識技術は日々進化していますが、まだまだ想像以上に認識率は低いのが現状です。

スマートフォンで電話している時のようにマイクと口の距離が近い場合、認識率は非常に高いのですが、ロボットのマイクまでの距離が遠く(30cm以上)、屋外など周囲がうるさい場所では、ノイズを除去する高度な技術が必須です。また、途中から別の声が加わった時など誰がしゃべっているのかを判定する話者推定技術も必要になります。こうした信号処理を経て、ようやく音声波形が音声認識エンジンに入力されて、どんな言葉かを認識します。その後、日本語であれば日本語構文解析、意味理解などをしていきます。この結果からようやくロボット側が何を返答すればいいかを決定するのです。

つまり、最初の集音と音声認識で誤認識すると、その後の処理にも大きく影響し、結果として、意図しない返事や数秒無音になる、といった状況を作り出してしまいます。伝言ゲームで最初の人が誤認識するとどんどんおかしくなっていくのに似ています。

こうなると、何度しゃべってもロボットが理解してくれない、「もう一度話してください」ばかり返事される、といった現象が起こり、ユーザーとしてはもう二度と使いたくないと思うはずです。「病院」と「美容院」の音声を誤認識することはまだまだありえるのです。

まとめると、音声UIでは下記の3つを高い精度で実現する必要があります。

  • 人の自然な言葉を正確に認識(誰が何を話したか、自然な発話をそのまま認識)
  • 人の言葉の意図を理解(何を言いたいのか、省略された言葉はなにかを補完する)
  • 自然に発話し返事(質問に沿った応答、自然な声で話す)

ロボットとの対話の難しさ

タッチパッド/タッチパネル操作と違って、音声はコミュニケーションツールとしても使います。同じことを伝えるのにも色々な言い方があります。「スカイツリーへの行き方教えて」「有名な、あのタワーへの道順…」「東京タワーじゃない方の高いツリー、ほら、あそこに行きたいのだけど」など同じスカイツリーへの案内を求める言い方は様々です。どんな発話をされても分析して「スカイツリーの道案内をする」という答えに導きだす必要があります。自然な発話から意味を理解して回答する技術は日進月歩ですが、まだまだ完璧ではありません。

一方でロボット側からの発話内容にも問題があります。

よくあるのが「何でもお話ください」というケースです。人間は「何でも話してください」といわれると寧ろ何を話していいか分からなくことが多いのです。そもそもそのロボットが何をできるのかが分からないのも問題です。考えた上に話しかけてみますが、その時に認識ミスが起こり変な回答をロボットがしたらどう感じますか?おそらく何を話したらちゃんと回答してくれるのか、とユーザーはまた考えます。ユーザーの発話の中になにか間違いがあったかはロボットからは指摘できません。一方で、ユーザーは「自分はちゃんとしゃべっているはずなのに」と疑問を感じ始めます。結果として、ユーザー側としては、「もう面倒だし話しかけないよ」となりかねません。

期待が大きいほど小さなミスは大きな失望感としてユーザーに跳ね返るのです。対話をインターフェースに使うというのはそういう欠点があることを知っておくべきです。

これはロボット側の対話のシナリオの作り方でカバーできます。今後は言語学、音声学やコミュニケーション学などを取り込んだ会話エンジンも開発が必要でしょう。

まとめ

Smart machines artificial intelligence concept

今回は、デジタルサイネージに利用され始めたロボットに注目してみました。

ロボットが、観光案内や商品販促をする時代になってきました。海外からの観光客向けに多言語にも対応して、そしてその言語で会話をすることができます。

このような機能を実現できているのも人工知能(AI)のおかげです。しかし、こと会話に関してはまだ多くの課題が残っています。人間同士ですらお互いの話をしている内容を全て理解できていない、といわれる『会話(対話)』を今後、技術でどうクリアしていくのか、はたまた、人間がロボットに合わせていくのか、非常に注目されます。

かつて看板やパネルを使って案内、情報提供、店舗販売促進をしていたサインは、ディスプレイを使ったデジタルサイネージにどんどん置き換わってきています。そして、今やその役割をロボットが担う時代になってきました。街中に溢れるサイネージディスプレイが今後ロボットに置き換わっていく時代が来るのでしょうか、興味深く見続けたいと思っています。

会員登録する
SIPOではデジタルサイネージ業界の最新動向を配信中。
会員登録して、いち早くニュースを受け取りましょう!

「いいね!」で
最新情報をお届け

サイネージ × AI