静的なデータの生成から、「動き」の生成へ。

Google DeepMind*が、言葉を元に四足歩行ロボットの動作を作り出す手法を編み出しました。しかもChatGPTなどがそうであるように、コマンドとは言えないような曖昧な言葉にもうまく反応してくれるようです。

*イギリスにて設立され、人工知能の研究と開発を行なった企業DeepMind。2014年にGoogleによって買収されGoogle DeepMindとなりました。

Google DeepMindの研究チームが、言語を四足歩行の動きに変換する手法「SayTap」を開発しました。人間の言葉を、ロボット犬が理解できる形に「翻訳」してくれるんです。

ロボットに「前に歩く」動きが事前にインストールされていなくても、「前に歩いて」と伝えれば、その通り動いてくれるということ。

「前に歩いて」「後ろに下がって」といった具体的な言葉だけじゃなく、もっとふわっとした、「リスをつかまえて」とか「地面が熱いから急いで」みたいな指示でどう動けばいいのか「理解」できるとのこと。

SayTap: Language to Quadrupedal Locomotion



paper page: https://t.co/Dk14Ds1D94



Large language models (LLMs) have demonstrated the potential to perform high-level planning. Yet, it remains a challenge for LLMs to comprehend low-level commands, such as joint angle targets or… pic.twitter.com/BteEUxEmal