双子机器人AI技术迈入现实世界

必读文章
李悦欣https://www.aistar.news
关注人工智能和医疗机器人,迷恋陶艺创作,将科技与手工艺术结合,探索未来医疗的无限可能。

谷歌DeepMind推出Gemini Robotics:将AI带入物理世界

近日,谷歌DeepMind正式发布了两款基于Gemini 2.0模型的新一代人工智能机器人模型——Gemini Robotics和Gemini Robotics-ER。这是AI从数字领域向物理世界迈出的重要一步,为机器人在实际环境中的应用拓展了广阔空间。此举标志着智能机器人技术的又一次跃升,为实现更高效、更安全、更智能的机器人解决方案奠定了坚实基础。

AI驱动的智能机器人:Gemini Robotics的三大突破

为了让机器人更广泛地服务于人类社区,AI能力必须具备三个核心特质:通用性交互性灵巧性。Gemini Robotics在这三方面均实现了重大突破。

  • 通用性:Gemini Robotics基于Gemini 2.0的世界理解能力,能够适应全新场景,解决从未“见过”的复杂任务,包括处理新物体、接受多样化指令以及应对未知环境。在通用性基准测试中,其平均表现比其他最先进的视觉-语言-动作模型提高了两倍以上。

  • 交互性:此模型充分利用Gemini 2.0的先进语言理解能力,支持多语言沟通,并能实时监测环境变化与指令调整,快速作出反应。在家居或工作场景中,Gemini Robotics可精准执行复杂的语音指令,同时对动态环境具有高适应力。

  • 灵巧性:相比传统机器人,Gemini Robotics 能够完成需要精细运动技能的复杂任务,例如折纸或将零食装入密封袋。这种卓越的操作灵活性,使其在实际应用中表现更贴近人类动作。

此外,Gemini Robotics 可以适配不同类型的机器人硬件,从广泛应用的机械臂平台到类人化的 Apollo 机器人,展现了卓越的适配能力。

双子机器人-ER:增强空间理解力的新范式

基于 Gemini 2.0 的扩展模型 Gemini Robotics-ER,进一步提升了 AI 对物理世界的空间感知和推理能力。得益于增强的视觉-语言理解,该模型在感知物体、空间定位以及动作规划等方面表现优异。例如,当面对一只咖啡杯时,它可以自主选择合适的抓取点及安全的行动路径,实现高效操作。

Gemini Robotics-ER还支持机器人各环节的端到端控制,包括感知、状态估计、空间理解、计划和代码生成。在标准化测试中,其成功率相比Gemini 2.0提升了两到三倍。更重要的是,该模型能够通过少量人类操作示范进行场景适配,实现动态学习与快速定制。

从安全到责任:为人机共存奠定基础

DeepMind在推进AI与机器人技术发展的同时,高度重视其安全性与社会影响。Gemini Robotics-ER集成了多层次的安全控制机制,从低层运动控制到高层语义理解,确保机器人在物理环境中的安全行为。例如,模型能够判断操作是否安全,并自动生成更适合的替代方案。此外,DeepMind还发布了新的数据集,以便研究人员评估和改进机器人在实际场景中的语义安全性能。

一种“数据驱动宪法”框架也被引入,用于描述机器人的行为规则。这些规则以自然语言表达,能够依据实际需求调整,帮助实现更安全、更贴合人类价值观的AI决策体系。

为确保技术的责任发展,DeepMind与其内部“责任与安全委员会”以及外部专家紧密合作,对潜在风险和机会进行全面评估。此外,Gemini Robotics-ER模型已通过受信测试者——如Agile Robots、Agility Robotics、Boston Dynamics等行业领先公司进行早期验证,以进一步完善机器人技术和应用。

未来展望:智能机器人与人类协作的新纪元

谷歌DeepMind与Apptronik建立了战略合作伙伴关系,共同开发新一代类人机器人,并邀请行业内外意见领袖参与早期测试与研发指导。作为一项具有深远意义的科技创新,Gemini Robotics及其相关模型的推出,不仅推动了AI与机器人领域的进程,还在广泛应用中为社会发展注入了新的动力。

DeepMind团队表示,他们将坚持负责、创新的理念,与合作伙伴和研究生态系统共同努力,推动AI和机器人领域迈向更加务实、更加智能的未来。

致谢
Gemini Robotics的开发由DeepMind的专业团队完成,更多详细信息和作者名单可访问官方来源。


您的浏览器不支持视频标签。https://www.aistar.news/wp-content/uploads/2025/03/2201_100.mp4

[AI之星网出品] [类人机器人研发] [AI与物理世界创新] [Gemini Robotics技术突破] [人机协作与安全性] [刘智勇频道][机器姬智能体][真机智能][机器洞察网][AI之星网][风投高科网][猛虎财经网][硅基科学网]


📚 更多资源分享:刘智勇频道第二卷

💾 百度网盘链接: https://pan.baidu.com/s/1ZymM4kNFajhq-ANDxHRl9Q?pwd=qwer

🔑 提取码: qwer


LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisement -
最新新闻

Robbyant开源LingBotWorld实时交互模拟与智能体AI模型

技术的未来并非止步于创造,而在于赋能更多创造者,让他们共同书写无限可能。 技术的未来并非止步于创造,而在于赋能更多创造者,让他们共同书写无限可能。 技术的未来并非止步于创造,而在于赋能更多创造者,让他们共同书写无限可能。
- Advertisement -

更多相关文章