DeepMind开发AutoRT新系统用AI大模型为机器人“发号施令”

日期:  2024-08-02   作者: 焊机维修

  不知道为什么,每次我要睡觉的时候,都非常不想收拾这些衣服,所以我宁愿把它们都堆在椅子上,然后告诉自己“明天再说吧”。若能的话,我愿意花大价钱将这项工作自动化。

  多亏了人工智能,我们未来或许真的能够正常的看到家务机器人的问世。几十年来,真正好用的家务机器人只存在于科幻小说中,这也是许多机器人科学家的最终目标。

  机器人并不聪明,我们觉得容易的事情它们却很难做到。能完成手术等很复杂工作的机器人通常售价高达数十万美元,贵得令人望而却步。

  我最近报道了美国斯坦福大学开发的名为 Mobile ALOHA 的新机器人系统,研究人员用它驱动了一个便宜的、可以轻松买到的带轮子的机器人,让它能完成一些极其复杂的事情,比如煮虾、擦拭污渍和搬动椅子。

  斯坦福大学助理教授切尔西·芬恩()是该项目的顾问,她说,机器人技术正处于一个转折点。过去,研究人员一直受到训练机器人所需数据量的限制。

  现在有了更多的可用数据,像 Mobile ALOHA 这样的工作表明,有了神经网络和更多的数据,机器人能非常快速、轻松地学习复杂任务。

  驱动聊天机器人的大型语言模型,依赖从网络上收集的庞大数据集才能完成训练,但训练机器人需要用真实场景中收集的数据。

  这使得构建庞大的数据集变得十分困难。纽约大学和 的研究小组最近想出了一个简单而聪明的方法来解决这一个问题。

  他们将 iPhone 绑在机械臂(抓取器)上并记录在实验参与者家里完成的任务。收集来的数据被用来训练一个名为 Dobb-E 的系统,可以在大约 20 分钟内完成 100 多项家庭任务。

  美国卡内基梅隆大学助理教授迪帕克·帕塔克()表示,Mobile ALOHA 还反驳了机器人界的一种观点,即主要是硬件缺陷阻碍了机器人完成此类任务。

  至于让机器人对语音指令做出一定的反应,以及更好地适应现实世界里的混乱环境,人工智能也可以派上用场:的 RT-2 系统能将视觉语言动作模型与机器人相结合。

  开发了一个名为 AutoRT 的新系统,使用类似的视觉语言模型来帮助机器人适应看不见的环境,并利用大型语言模型来为一队机器人提供指令。

  不过,即使是最先进的机器人也做不到帮人洗衣服,因为这项家务对于机器人来说实在太难了。堆起来的衣服没什么规律可言,形状千奇百怪,这使得机器人很难处理它们。

  但这可能只是时间问题,来自斯坦福大学的研究人员 说。他乐观地认为,即使是最棘手的任务,总有一天机器人也有一定的可能用AI来完成。只不过它们需要先收集好的数据。

  作者简介:梅丽莎·海基莱(Melissa Heikkilä)是《麻省理工科技评论》的资深记者,她着重报道人工智能及其如何改变我们的社会。此前,她曾在 POLITICO 撰写有关人工智能政策和政治的文章。她还曾在《经济学人》工作,并曾担任新闻主播。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  造车新势力7月销量:理想破5万创月交付量新高,蔚来连续3个月交付超2万

  中国女排3-0法国女排 小组赛两连胜提前出线自接力铜牌 澳大利亚破奥运纪录夺金

  中国女排3-0法国女排 小组赛两连胜提前出线自接力铜牌 澳大利亚破奥运纪录夺金

  关注丨痛心!年仅27岁中国男子泰国普吉岛游泳失踪身亡,中国驻泰领馆紧急提醒游客

  张凌赫×贺聪,王安宇×春夏......品牌方怎么比偶像剧导演还会选人!

  TCL华星成LGD广州厂优先竞买方!韩厂将彻底退出LCD TV面板竞争速读公告

  苹果Vision Pro有望采用三星Tandem Micro OLED

  广电总局:2024 上半年全国广播电视服务业总收入 6683.57 亿元