英伟达发布人形机器人通用基础模型,黄仁勋:这是AI领域中最令人兴奋的课题之一
必须更多木
发表于 2024-3-19 11:22:49
1116
0
0
GR00T驱动的机器人将能够理解自然语言,并通过观察人类行为来模仿动作。其能快速学习协调各种技能,具备更好的灵活性,以适应现实世界并与之互动。
“开发通用人形机器人基础模型是当今AI领域中最令人兴奋的课题之一。世界各地的机器人技术领导者正在汇集各种赋能技术,致力于在人工通用机器人领域实现突破。”英伟达创始人兼CEO黄仁勋说。
在他的GTC大会主题演讲中,通过视频展示了数台这样的机器人是如何完成各种任务的。
其中包括医疗和物流搬运、分拣用的机械臂,也包括可以做打果汁等家务的人形家用机器人,还有的机器人可以模仿人类打架子鼓,也可以从视频中学习人类的舞蹈动作并进行模拟。基于大语言模型,有的人形机器人还可以理解人类的口头指令,并做出回应。
展示视频之后,黄仁勋和身后由英伟达芯片和服务驱动、训练的一列机器人一同向观众致意,画面充满了科幻感。
黄仁勋GTC大会主题演讲
英伟达还发布了一款基于NVIDIA Thor系统级芯片(SoC)的新型人形机器人计算机Jetson Thor,并对NVIDIA Isaac机器人平台进行了重大升级,包括生成式AI基础模型和仿真工具,以及AI工作流基础设施。
该SoC包括一个带有transformer engine的下一代GPU,其采用NVIDIA Blackwell架构,可提供每秒800万亿次8位浮点运算AI性能,以运行GR00T等多模态生成式AI模型。凭借集成的功能安全处理器、高性能CPU集群和100GB以太网带宽,大大简化了设计和集成工作。
训练具身智能模型需要海量的真实数据和合成数据。新的Isaac Lab是一个GPU加速、性能优化的轻量级应用,基于Isaac Sim而构建,专门用于运行数千个用于机器人学习的并行仿真。
许多机器人正是在Isaac Lab中进行大量训练,学习了如何完成任务。迪士尼生产的使用相关英伟达芯片的,名为Orange和Green的小型机器人也来到现场,黄仁勋介绍,它们正是在Isaac平台里学会了走路。
来到演讲现场的迪士尼机器人Green
英伟达正在为人形机器人公司开发一个综合的AI平台,如1X Technologies、Agility Robotics、Apptronik、波士顿动力公司等等。
“下一代机器人很有可能是人形机器人,因为我们有更多的模仿训练数据可以提供给和我们构造相似的机器人们。人形机器人可以更有效率地部署在人类设计的工作站、制造和物流环节中。”黄仁勋说。
随着人口老龄化的加剧和劳动力成本的持续上升,人形机器人行业正迎来发展机遇。GGII(高工产业研究院)报告显示,到2026年,全球人形机器人市场规模有望超过20亿美元。
而机器人在这个时间点爆发,生成式AI是背后的最大推手。英伟达机器人和边缘计算副总裁Deepu Talla在今年的CES上表示,有了大语言模型(LLM),机器人能够更自然地理解和响应人类指令;有了生成式AI,机器人能够实现前所未有的感知和适应能力。高盛此前也表示,人形机器人将成为智能驾驶电动车后的又一AI落地场景。
“AI和机器人硬件的结合确实是一个极具想象空间的事情,这是2023年为数不多的投资风口之一。”祥峰投资管理合伙人夏志进对界面新闻表示。
去年12月,特斯拉发布了Optimus机器人第二代,马斯克表示部分Optimus很有可能在明年交付。紧接着今年1月,厨艺极佳的斯坦福机器人Mobile ALOHA火遍全网。3月,Figure发布OpenAI大模型加持的机器人Figure 01演示视频再度刷屏,其能够与人类进行流畅对话,并分析执行口头指令。
英伟达也跟着这波浪潮,在2月宣布成立通用智能体研究实验室(GEAR),旨在虚拟和现实世界中构建具身智能体基础模型,专注于多模态基础模型、通用型机器人研究、虚拟世界中的基础智能体、模拟和仿真数据这四个领域。
在今年的GTC上,Agility Robotics、波士顿动力公司、迪士尼和Google DeepMind等公司将在现场展出25款机器人及相关产品,包括人形机器人、机械臂、机器人视觉系统和高精度3D扫描系统等。
同时,有多场会议与机器人有关,涵盖机器人操纵、导航、感知、计算、仿真/合成数据生成等多方面内容。
有业内声音认为,2024年或将成为人形机器人量产的元年。大模型的井喷也的确让人形机器人有了更多新机会,但前提是技术瓶颈、高昂成本等老问题不再成为新难题。
逐际动力创始人张巍对界面新闻表示,现在大部分机器人只达到了“平地走两步”的状态,让它去顺利地帮我们拿东西仍然很难。
在英伟达媒体沟通会上,Deepu Tella提到,目前还是人形机器人发展的初期阶段,第一批使用的案例主要会集中在劳动力短缺的制造业,但随着一些通用问题的解决,人形机器人将更多地应用于服务业、医院甚至家庭。
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.