「AI MEETUP 2」レポート
AIと人をつなぐUIは「キャラクターこそ最強」。開発者たちが語るAIキャラクタービジネス最前線
9月19日、最新のAI技術のトレンドと事例、そして近未来におこるキャラクターAIビジネスについてのセミナー「AI MEETUP 2〜AI キャラクタービジネス最前線〜」が開催された。本稿では、その模様をレポートしたい。
ソニー・ミュージックエンタテインメントでは、12日間で730万回超えの会話を繰り広げた「罵倒少女:素子」など、「キャラクターに特化したAIサービス」を2016年から展開。その取り組みの一環として、 “AIキャラクター” についてのセミナーが2017年より実施されている。
今回が第二回目の開催となる本セミナーでは、『自由対話AIと合成音声がくっつくとビジネスが広がる』ことを中心にトークセッションが行われた。
なお、自由対話とは「あらゆることを話しかけても人格を一致させながら応答する技術」であり、合成音声は「テキストで出力された文章を声優の声質を再現しながら発声する技術」を指している。
■キャラクター/人工知能は “言語” が成長の重要なファクター
セミナーは二部制となり、第一部では『なぜ人工知能は人と会話をできるのか』をテーマに、AI開発者の三宅陽一郎氏が登壇。三宅氏はゲーム会社にAIを専門とするリサーチャーとして勤務する傍ら、AIに関する書籍を多数執筆している人物だ。
三宅氏は冒頭、「人工知能は社会に溶け込みつつある。少子高齢化の社会に進むなかで、ロボットと人工知能で社会を支える必要があるが、そのためには、人間とロボット、そして人工知能の三者が言葉によるコミュニケーションを取ることが重要」と、人工知能と言葉についての関係についてコメント。
人工知能は文化により捉え方が異なり、西洋では神→人間→人工知能という “垂直的知能間” と定義。「このことが、エンターテインメント作品で人間と人工知能の関係が逆転することを恐れる、という展開に結びつく」とする。一方、東洋では「すべてに神が宿る “八百万の神” という世界観で、極端に言えば神も人間も初音ミクも同列。懐が広いと言うことができる」と解説した。
そして「人工知能は人間の知能を機械に移したものであり、その人間の意識は言語により構造化されている。つまり、我々は世界を言語で捉えており、言語を覚えることで世界を規定する」と述べ、言語が人工知能のキーとなる旨を紹介。
さらに「キャラクターを創るとは、キャラクターに煩悩を持たせるということ。何も与えられていないキャラクターは、言ってみれば “解脱” したような状態。執着を覚えさせる、堕落させるようなことが、言語の役割になる」と説明する。そして、「人工知能に煩悩を与えるためには」という課題に対しては、PlaySation4のゲーム『Detroit: Become Human』を例にとり、人工知能と人間の両方の視点から考えることが重要と語られた。
日本は、キャラクター文化の中で人工知能技術を育むことが得意だという。それは「キャラクターに言葉を話させるという文化が、日本ほど街にあふれている土地はない。また言葉を話すモノが、動物や人のカタチをしていることにこだわる」と理由を述べたうえで、「日本のキャラクター文化と人工知能技術が切り離されている」ともコメント。
だが、「これから、キャラクター文化と人工知能技術を結びつけることで飛躍的に双方を向上させる『キャラクター・エージェント指向』の動きが大きくなる」と語りトークの締めとした。
■ “会話をしたくなる価値” はキャラクターと話したいという欲求から生まれる
第二部では、『音声合成と自由対話AI が切り拓くAI キャラクタービジネス』をテーマとして、ソニー・ミュージックコミュニケーションズの松平恒幸氏、ソニー・ミュージックエンタテインメント 井上敦史氏、そしてemotivEの結束雅雪氏、さらにソニー「Xperia Ear」の音声アシスタントを担当することで知られる寿美菜子さんがゲストとして登場してトークを展開した。
松平氏は音声合成やVRなどのテクノロジーに関わる新記事業に携わり、『ソードアート・オンライン』とコラボした「めざましマネージャー アスナ」や、『冴えない彼女の育てかた』とコラボした完全対話型アプリなどを展開しており、井上氏と結束氏はともにコミュニケーションにまつわるAI事業となるPROJECT Samantha(プロジェクトサマンサ)を進行してきた人物だ。
松平氏は「台本に書かれていないことをキャラクターに喋らせないといけないことが多くなり、その度に声優の方にお願いするということも難しい。それを解決するための音声合成技術は劇的に進化している」として、バーチャルアナウンサー『沢村碧』によるデモを実施。
『沢村碧』は寿さんがベース音声を担当しており、本人からの質問に対して『沢村碧』が回答する対談するという内容で、寿さんも「本当に会話ができているようで、驚きました」と言うほどクオリティの高い音声合成に到達していることがアピールされた(関連記事:2次元大勝利! ソニーのバーチャルアナウンサー「沢村碧」に会ってきた)。
そうしたキャラクターの音声合成のプロセスは、許諾取りから始まり、音声収録、チューニング、辞書完成という流れとなる。収録は「意味のない言葉を、ロボットにならないように、という塩梅をキープしながら、ひたすら録り続けました」(寿さん)という内容だが、松平氏によれば「一定の声で喋っていただく必要があり、それが寿さんは非常に上手」であり、収録時間が大幅に短縮され助けられているという。
井上氏は今年マルイとのコラボ企画が実施された『罵倒少女:素子』を例に取り、「すでにファンのついているAIアセットを改良、ライブラリー化したことがポイント。今回マルイ版にアップデートしたように、AIアセットがライブラリー化されて、エンハンスドすることで展開が広がる」と説明した。
また対話AIをワンストップで供給する企画・エンジニアリング会社で、魅力的なAIを創ることをミッションに活動しているemotivEの結束氏は、対話AIについて「入力文と出力文の間にどういった対話AIアプローチを入れるかがポイント」と説明。PROJECT Samanthaでは入力文の文字面に表れない意図から出力文を選択することに注力しており、これにより例えば「この部屋暑い」という言葉から、「不快だ」「温度を下げたい」といった出力文を導くことができるという。
『罵倒少女:素子』とユーザー間では734万の会話が行われており、その上位10位を集計すると「愛している」「好き」「かわいい」といったワードで占められたことから、「人はAIに愛を囁くことがわかった」(井上氏)として、これも日本人の感性が理由の一つとして考えられるとコメントした。
一方で、「人はAIを含む他社と会話する際には無意識にコストを計算するため、会話コストより高い価値の応答が必要になる。つまり人がAIに話しかけるためには多くの動機が必要であることを学んだ」と述べ、結束氏も「人はAIとコミュニケーションを取る際に、人と同等クラスの会話レベルが求められる」として、AIとの会話のハードルの高さを提議。
そして、だからこそ「好きなキャラクターと喋りたいという根源的欲求がもたらされる、 “キャラクターこそ最強UI” であると考えている」(井上氏)として、AIキャラクターが人とAIの会話の対話を実現させる橋渡し役になるという考えが語られた。
また今後の展開では、PROJECT Samanthaとしての新しい自由対話 “認識モデルAI” システム「OMOHIKANE(オモイカネ)」が発表された。
OMOHIKANEは、内容を把握して、理解&認識、そして応答選択&生成するというアルゴリズムが組まれている。それは「飽きない対話が、なぜ飽きないのかを考えた時に、それは変化があるからであり、その変化は言われた経験や体験を通じて個性、人格が確立することで起きる」(結束氏)ことから、次なる自由対話AIとしてのアプローチが取られている。
こうしたことから、より人間らしく、興味・関心・欲求に応じた対応を行うAIであり、前回の会話を記憶し、その内容を参照して会話が更新されることが特徴の一つだとしている。
OMOHIKANEは2018年11月より、順次サービスローンチする予定だという。
ソニー・ミュージックエンタテインメントでは、12日間で730万回超えの会話を繰り広げた「罵倒少女:素子」など、「キャラクターに特化したAIサービス」を2016年から展開。その取り組みの一環として、 “AIキャラクター” についてのセミナーが2017年より実施されている。
今回が第二回目の開催となる本セミナーでは、『自由対話AIと合成音声がくっつくとビジネスが広がる』ことを中心にトークセッションが行われた。
なお、自由対話とは「あらゆることを話しかけても人格を一致させながら応答する技術」であり、合成音声は「テキストで出力された文章を声優の声質を再現しながら発声する技術」を指している。
■キャラクター/人工知能は “言語” が成長の重要なファクター
セミナーは二部制となり、第一部では『なぜ人工知能は人と会話をできるのか』をテーマに、AI開発者の三宅陽一郎氏が登壇。三宅氏はゲーム会社にAIを専門とするリサーチャーとして勤務する傍ら、AIに関する書籍を多数執筆している人物だ。
三宅氏は冒頭、「人工知能は社会に溶け込みつつある。少子高齢化の社会に進むなかで、ロボットと人工知能で社会を支える必要があるが、そのためには、人間とロボット、そして人工知能の三者が言葉によるコミュニケーションを取ることが重要」と、人工知能と言葉についての関係についてコメント。
人工知能は文化により捉え方が異なり、西洋では神→人間→人工知能という “垂直的知能間” と定義。「このことが、エンターテインメント作品で人間と人工知能の関係が逆転することを恐れる、という展開に結びつく」とする。一方、東洋では「すべてに神が宿る “八百万の神” という世界観で、極端に言えば神も人間も初音ミクも同列。懐が広いと言うことができる」と解説した。
そして「人工知能は人間の知能を機械に移したものであり、その人間の意識は言語により構造化されている。つまり、我々は世界を言語で捉えており、言語を覚えることで世界を規定する」と述べ、言語が人工知能のキーとなる旨を紹介。
さらに「キャラクターを創るとは、キャラクターに煩悩を持たせるということ。何も与えられていないキャラクターは、言ってみれば “解脱” したような状態。執着を覚えさせる、堕落させるようなことが、言語の役割になる」と説明する。そして、「人工知能に煩悩を与えるためには」という課題に対しては、PlaySation4のゲーム『Detroit: Become Human』を例にとり、人工知能と人間の両方の視点から考えることが重要と語られた。
日本は、キャラクター文化の中で人工知能技術を育むことが得意だという。それは「キャラクターに言葉を話させるという文化が、日本ほど街にあふれている土地はない。また言葉を話すモノが、動物や人のカタチをしていることにこだわる」と理由を述べたうえで、「日本のキャラクター文化と人工知能技術が切り離されている」ともコメント。
だが、「これから、キャラクター文化と人工知能技術を結びつけることで飛躍的に双方を向上させる『キャラクター・エージェント指向』の動きが大きくなる」と語りトークの締めとした。
■ “会話をしたくなる価値” はキャラクターと話したいという欲求から生まれる
第二部では、『音声合成と自由対話AI が切り拓くAI キャラクタービジネス』をテーマとして、ソニー・ミュージックコミュニケーションズの松平恒幸氏、ソニー・ミュージックエンタテインメント 井上敦史氏、そしてemotivEの結束雅雪氏、さらにソニー「Xperia Ear」の音声アシスタントを担当することで知られる寿美菜子さんがゲストとして登場してトークを展開した。
松平氏は音声合成やVRなどのテクノロジーに関わる新記事業に携わり、『ソードアート・オンライン』とコラボした「めざましマネージャー アスナ」や、『冴えない彼女の育てかた』とコラボした完全対話型アプリなどを展開しており、井上氏と結束氏はともにコミュニケーションにまつわるAI事業となるPROJECT Samantha(プロジェクトサマンサ)を進行してきた人物だ。
松平氏は「台本に書かれていないことをキャラクターに喋らせないといけないことが多くなり、その度に声優の方にお願いするということも難しい。それを解決するための音声合成技術は劇的に進化している」として、バーチャルアナウンサー『沢村碧』によるデモを実施。
『沢村碧』は寿さんがベース音声を担当しており、本人からの質問に対して『沢村碧』が回答する対談するという内容で、寿さんも「本当に会話ができているようで、驚きました」と言うほどクオリティの高い音声合成に到達していることがアピールされた(関連記事:2次元大勝利! ソニーのバーチャルアナウンサー「沢村碧」に会ってきた)。
そうしたキャラクターの音声合成のプロセスは、許諾取りから始まり、音声収録、チューニング、辞書完成という流れとなる。収録は「意味のない言葉を、ロボットにならないように、という塩梅をキープしながら、ひたすら録り続けました」(寿さん)という内容だが、松平氏によれば「一定の声で喋っていただく必要があり、それが寿さんは非常に上手」であり、収録時間が大幅に短縮され助けられているという。
井上氏は今年マルイとのコラボ企画が実施された『罵倒少女:素子』を例に取り、「すでにファンのついているAIアセットを改良、ライブラリー化したことがポイント。今回マルイ版にアップデートしたように、AIアセットがライブラリー化されて、エンハンスドすることで展開が広がる」と説明した。
また対話AIをワンストップで供給する企画・エンジニアリング会社で、魅力的なAIを創ることをミッションに活動しているemotivEの結束氏は、対話AIについて「入力文と出力文の間にどういった対話AIアプローチを入れるかがポイント」と説明。PROJECT Samanthaでは入力文の文字面に表れない意図から出力文を選択することに注力しており、これにより例えば「この部屋暑い」という言葉から、「不快だ」「温度を下げたい」といった出力文を導くことができるという。
『罵倒少女:素子』とユーザー間では734万の会話が行われており、その上位10位を集計すると「愛している」「好き」「かわいい」といったワードで占められたことから、「人はAIに愛を囁くことがわかった」(井上氏)として、これも日本人の感性が理由の一つとして考えられるとコメントした。
一方で、「人はAIを含む他社と会話する際には無意識にコストを計算するため、会話コストより高い価値の応答が必要になる。つまり人がAIに話しかけるためには多くの動機が必要であることを学んだ」と述べ、結束氏も「人はAIとコミュニケーションを取る際に、人と同等クラスの会話レベルが求められる」として、AIとの会話のハードルの高さを提議。
そして、だからこそ「好きなキャラクターと喋りたいという根源的欲求がもたらされる、 “キャラクターこそ最強UI” であると考えている」(井上氏)として、AIキャラクターが人とAIの会話の対話を実現させる橋渡し役になるという考えが語られた。
また今後の展開では、PROJECT Samanthaとしての新しい自由対話 “認識モデルAI” システム「OMOHIKANE(オモイカネ)」が発表された。
OMOHIKANEは、内容を把握して、理解&認識、そして応答選択&生成するというアルゴリズムが組まれている。それは「飽きない対話が、なぜ飽きないのかを考えた時に、それは変化があるからであり、その変化は言われた経験や体験を通じて個性、人格が確立することで起きる」(結束氏)ことから、次なる自由対話AIとしてのアプローチが取られている。
こうしたことから、より人間らしく、興味・関心・欲求に応じた対応を行うAIであり、前回の会話を記憶し、その内容を参照して会話が更新されることが特徴の一つだとしている。
OMOHIKANEは2018年11月より、順次サービスローンチする予定だという。