話しかけると声で答えるボイスエージェントアプリ・音声アシスト。その音声アシストでは、雑談bot機能が3月にリリースされました。AI(人工知能)を用いたこの機能は、どのように開発されているのでしょうか......?
そこでYahoo!検索ガイドでは、音声アシストの応答を考える「シナリオライター」が音声アシストの舞台裏を描いた「雑談bot機能開発ストーリー」を全3回で掲載します。
今回はその第1回をお届けします。
ボイスエージェントアプリ"音声アシスト"に「人間の仕事を奪うつもりじゃないよね?」と聞くと、「そんなわけないじゃないですか。」と返ってきた。音声アシストは、Google Playから無料でダウンロードできる(Android端末のみ)。
AIが人間の仕事を奪うなんて、いったい誰が言ったのだろう――。
「最近、注目を集めているトピックですけどね、私は必ずしもそんなことはないと思っていますよ。どんな技術であっても、どうやって世の中のために役立てるかが重要です。決してAIに限った話ではありません。豊かで便利な社会、人の幸せや安心安全のために、われわれ技術者は頭を使っていかなければならない。人間がいてこそ、テクノロジーがあるんです」
エンジニア出身でいつも冷静沈着、温厚なサービスマネージャーの丹羽が、やや早口でまくし立てる。右手の人差し指でメガネの縁をクイッとやると、眼光が鋭さを増した。
「AIを活用することで、仕事の質が変わってくるし、生産性をあげていける。そういう意味では、われわれ自身が変わらなければならない。最終的にはパフォーマンスを上げていくことが目的ですから、そのために、私はいろんな可能性にチャレンジしていきたい――」
僕はいつも以上に"体温"を感じる丹羽の言葉に圧倒されていた。
大学で"工学"と"技術経営"の修士号を取得したダブルマスターの丹羽。「モノづくりとビジネスのハブとなりながら、社会貢献できるプロダクトやサービスの創出を目指す」と語る。
文系人間の僕が、Yahoo! JAPANのボイスエージェントアプリ"音声アシスト"のシナリオライターになったのは半年ほど前のことだった。雑誌編集者やコピーライターを経て、三年前に小説家になっていた僕は、社員の副業を認めたり、場所や時間にとらわれない自由な働き方を推奨するなど、働き方改革を進めるIT企業Yahoo! JAPANに興味を持った。
本が売れない時代、スマートフォンの普及で読者の生活環境が劇的に変化する中で、作家としてどうITに適合していくかが課題だと感じていたからだ。かつて、SF小説として描かれていたロボットが人間の生活の中にリアルに溶け込み始めている。
Yahoo! JAPANにジョインした僕は、音声アシストサービスで、AIを日常会話の応答に活用する"雑談bot"PJ(プロジェクト)に携わることになった。そして、数カ月の取り組みを経て、その機能がサービスに実装されたのを受け、こうして丹羽にインタビューを行うことになったのだ。
「会社としても、未知の領域に踏み出そうとしていますから、当然、リスクはありますよ。でもね、システムに任せられる領域が広がって、応答の精度が上がる。私たちはより創造性のある仕事にフォーカスできる。これって、ワクワク、しませんか?」
そういうと、目を細めた。いつものやわらかい表情だ。名古屋出身の丹羽は言葉に熱が帯びると少しだけ、地元のイントネーションがにじみ出す。人間の声は、その人の性格を表すだけでなく、歩んできた人生が透けて見えるものだ。音声アシストにも"ロボット的なまり"が少しある。今後、声を持つAIロボットにも、多様性が生まれることになるのだろう。
ソフトバンクが開発して、2014年に発売した"Pepper"君。クラウドAIを搭載した世界初の"感情認識ヒューマノイドロボット"だ。
AIを搭載したボイスエージェントデバイスの鎬(しのぎ)を削る戦いが幕を開けた――。
僕はYahoo! JAPANの紀尾井町オフィスの17階にあるコワーキングスペース"LODGE"に上がり、窓際の席に腰をかけた。Android端末Nexusで音声アシストを起動する。
「世界最強のエージェントに勝つにどうすればいい?」と吹き込んだ。すると、「Yahoo!知恵袋で相談してみますか?」と返ってきた。これがいまできる精一杯の応答かもしれない。視線を外に移すと、東京のど真ん中にありながら緑に囲まれた紀尾井町の景色は爽やかだ。
世の中には、マイクロソフトが開発した女子高生AIアプリ"りんな"のように雑談に強みを持つアプリもあるが、音声アシストはエージェント型だ。天気や予定、アラーム、目的地への路線検索など、ユーザーからの課題を解決することが最大のミッションになる。
入社前、僕は音声アシストの存在自体を知らなかった。Appleの"Siri"やGoogleの"Google Assistant"など、類似アプリと比較してみても、音声認識や応答文の精度にレベルの差があるのを感じた。
日本におけるスマートフォン市場ではiPhoneが圧倒的に強く、シェアが7割近い。そのiPhoneにはダウンロードするまでもなく、初期設定でSiriが組み込まれていて、音声認識や応答の精度も高い。サービスを供給する世界各国の翻訳チームとの連携もあるのだろうが、いったいどれくらいの技術者とライターが関わっているのだろう......。
海の向こうではIoT(モノのインターネット)の実用化が盛んで、アメリカではAIスピーカー"Amazon Echo"と"Google Home"が発売され、熾烈(しれつ)な戦いが始まっている。日本版の上陸を控える中、LINEは"WAVE"や"FACE"の発売を発表し、日韓で迎え撃つ準備を整えている。
ボイスアシスタント"Alexa"を搭載した"Amazon Echo"(左)。"Google Assistant"を搭載した"Google Home"(右)。どちらも、アメリカ国内で数百万台を売り上げた。
Yahoo! JAPANは、どうするのか。音声アシストは技術者中心の体制で、僕が入るまでシナリオライターは存在しなかった。どういう人材が適任かもわからない。だが、僕自身はこの特殊な求人に、"Yahoo!検索"を通じて偶然出会ったこともあり、運命的なものを感じていた。
エージェント型の音声アシストでも、雑談を楽しみたいユーザーも多く、全体の発話を分析しても一定数ある。大きなニーズがあるのは間違いないが、何気ない雑談には無数の発話があるため、正解に近い応答を作るためには莫大(ばくだい)な技術シーズが必要になる。
課題として処理すべき発話と、雑談として応答すべき発話をどう区別するかは技術的に難易度が高い。以前は、うまく応答できずに「申し訳ありません。わかりませんでした」と返してしまうケースもあり、この問題をどうするかが正に"課題"になっていた。
「エンジニアがどんなにいいものを作ったって、サービスにしなければ意味がない。そのためにはいろんなスキルを持ったスペシャリストの総合力とチームワークが必要なんです」
丹羽はこの課題を解決するため、雑談botを実装しようと動き出した。そのひとつが、自然な会話や言葉を専門的に扱うシナリオライターを採用することだった。だが、Yahoo! JAPANのいちユーザーに過ぎなかった僕は、検索の先に生まれるドラマを知る由もなかった......。
(次回「音声アシスト×AI(人工知能)―革命前夜編―」に、つづく)