
最新の大規模言語モデルによって、ロボットはこれまでにない「人間らしい会話」を実現できるようになりました。しかし、実際の社会で人と共生するには、さらに一歩踏み込んだ設計が求められます。本稿では、人間の心に働きかけるロボットの振る舞いと、その効果を紹介しながら、これからのロボット研究に不可欠な「人間理解」について考えます。
ソーシャルロボットに求められる「人間らしさ」とは
最近、街中で人間のように働くロボットをよく見かけないでしょうか。来訪者にフロアを案内したり、レストランで配膳を手伝うロボットの姿を思い浮かべるかもしれません。これらのロボットには、工場等で使われる産業用ロボットとは異なり、人との社会的なやりとりが求められます。
人と同じ空間で活動し、会話やコミュニケーションを行うロボットは「ソーシャルロボット」と呼ばれます。ソーシャルロボットは人工物でありながら、人と接するにあたっては「人らしい振る舞い」がなければ受け入れてもらえません。
たとえば、ロボットとの会話ひとつとっても、そこに「人間らしさ」を感じられなければ、人は違和感を覚えてコミュニケーションを続けようとは思わなくなってしまいます。そのため、社会的に受け入れられるロボットをつくるには、「人間はどのような本性を持っているか」を理解することが欠かせないのです。
他方で、近年ではChatGPTに代表される大規模言語モデル(Large Language Model:LLM)が広く利用されるようになっています。簡単に言えばLLMは、入力された文章に対して、次に来る自然な言葉を予測して並べる仕組みで動いています。最新のベンチマークでは博士号レベルの問題に答えられるなど、「賢いシステム」であることは疑いようがありません。メールの代筆や文章のリライトといった実用的な使い方にとどまらず、雑談を楽しんだり、役割や性格を指定して会話をするなど、「人間らしい」やりとりも可能になっています。
では、このようなLLMをそのままロボットに組み込めば、人間と同じように接することができるロボットになるのでしょうか?
残念ながら、そう単純ではありません。どれほどチャットがスムーズにできても、実際の生活環境では予測できない状況が生じます。人間にとって当たり前の行動が、ロボットにはまだ難しいことも多いのです。
というのも、LLMは基本的に言語をベースとした情報処理を行っているからです。現実には人もロボットも物理的な環境に存在しているため、身体動作についても互いに影響を与えています。たとえば「あそこのあれを取って」などと人が頼んだとき、指示が曖昧でロボットが対象を一意に特定できない場合があります。そのとき、ロボット側からのアプローチで人側からさらなる情報を引き出すことができれば、コミュニケーションはもっと円滑になるはずです。
ここで注目したいのが「引き込み現象」です。これは、独立して動いていたものが互いに影響し合うことでタイミングが自然に揃ってしまう現象を指します。これを応用して、ロボットの方から指さしをおこなうことで人間の指さしを誘発し、指示対象を絞るなどといった手法が考えられます。
従来のロボット工学では、センシングの技術を向上させることが人とロボットの関わり合いにおいて重要だと考えられてきました。しかし、その考え方を逆転させて、人とロボットの相互作用(ヒューマンロボットインタラクション)を研究する方向からも、ロボットの認識やタスクの成功率は向上させられると私は考えています。
※記事の内容は、執筆者個人の考え、意見に基づくものであり、明治大学の公式見解を示すものではありません。
