您的位置:首页 >综合要闻 >正文

谷歌正在使用Gemini AI训练机器人导航世界

摘要 谷歌也加入了这一潮流,推出了 Gemini 机器人,用于设计理解周围环境、处理复杂任务和记忆信息的机器人。虽然这些发展可能还不等同于拥有...

谷歌也加入了这一潮流,推出了 Gemini 机器人,用于设计理解周围环境、处理复杂任务和记忆信息的机器人。虽然这些发展可能还不等同于拥有个人助理,但我们正在接近真正有用的日常机器人助手。最近,谷歌的 DeepMind 团队展示了 Gemini1.5 如何使机器人能够记录重要位置并在现实场景中无缝导航。

在 Instagram 上分享的视频中,一名团队成员展示了机器人如何将他们带到白板前,要求他们展示可以画画的地方。在命令发出后,可以听到机器人说:“好的,用 Gemini 思考。请给我一分钟。”虽然实验看起来很有希望,但机器人在收到请求和采取行动之间明显有长达一分钟的延迟。尽管如此,谷歌的项目让我们可以一窥这些机器人在不久的将来可能会如何在我们的家中和办公室中发挥作用。

在分享这段有趣的视频时,该团队解释道:“借助 Gemini1.5 Pro 的长上下文窗口,我们挑战了辅助机器人如何在繁忙的办公室中找到自己的路。”

为了训练机器人,DeepMind 团队带着机器穿过了不同的区域,并向它展示了重要的地点和物体。然后,机器人会创建一个思维地图来记住这些地点和物品,以供日后使用。虽然目前还处于早期阶段,但 Gemini 机器人未来可以提供更精确的细节。

DeepMind 发表的研究论文显示,该机器人在 9000 平方英尺的范围内执行 50 多条用户指令的成功率高达 90%。该团队还发现,Gemini1.5 Pro 可以让机器人规划除简单导航之外的其他动作。

正如论文中所强调的,如果一个办公桌上有多罐可乐的用户询问厨房里是否有他们最喜欢的饮料,Gemini“知道机器人应该导航到冰箱,检查是否有可乐,然后返回向用户报告结果。”同时,该团队计划进一步探索这些功能。

版权声明:本文由用户上传,如有侵权请联系删除!