根据中国计算机学会的定义,具身智能(Embodied Artificial Intelligence)涉及人工智能、机器人学习、计算机视觉等学科,实质是强调有物理身体的智能体通过与物理环境进行交互,从而获得智能的人工智能研究范式。
眼下,作为人工智能领域的前沿热点,具身智能正逐步从理论走向实践,从实验室走向现实。但对这一潜力巨大的“蓝海”市场,很多人尚觉得陌生。具身智能可以做什么、改变什么,与大模型之间有怎样的关联?这些疑问的背后,预示着代表了软硬件耦合共生、相互赋能的具身智能,正飞速走进人类的生产和生活。
大会现场
为何是当下
2023世界人工智能大会,生成式人工智能(AIGC)成为绝对主角,“具身智能”的关注度也扶摇直上。但非业界人士则一头雾水,“第一次听说。”
具身智能是一种怎样的“智能”?上海交通大学教授卢策吾提供了一种定义。“通俗说,就是具有身体的智能,电脑可视作‘没有身体的智能’代表。”在他看来,聚焦具身智能,现在恰逢其时。从科学角度看,人类对自身、对视觉的理解以及运动控制技术达到的水平,集合起来已经能形成一个围绕具身智能的科学范畴。而从产业角度看,目前具身智能涉及的软硬件技术已初步成熟,整个产业正蓄势待发。
中国工程院院士、中国人工智能学会(CAAI)理事长戴琼海表示,今年政府工作报告指出将深化大数据、人工智能等研发应用,开展“人工智能+”行动。具身智能恰恰是当前人工智能技术走向物理世界的前沿方向,既是机器学习、自然语言处理、计算机视觉等技术的集成应用,更是对类人能力和类人智慧的挑战与探索。
爆发点就在当下。中国工程院院士蒋昌俊表示,以OpenAI为代表的企业利用大量互联网文本和图像数据,构建了ChatGPT等大语言模型,首次展示了AI解决多种任务的能力,也让人类看到了跨越领域限制、实现通用人工智能(AGI)的潜力。
“虽然ChatGPT等大模型已展现出处理多模态数据和满足人类需求的交互能力,但这种交互仍局限于数字世界。”蒋昌俊表示,要实现真正的通用人工智能,需要赋予AI在真实物理世界中交互的能力。这意味着要让AI拥有实体,像人类一样具备感知、思考和行动能力。
松灵机器人
作为人工智能与机器人两大前沿技术的结合,具身智能被视为新质生产力的重要组成部分。去年5月,芯片制造商英伟达首席执行官黄仁勋也曾表示,人工智能的下一个浪潮将是具身智能,即能理解、推理并与物理世界互动的智能系统。
对于具身智能目前的“隐隐爆发”之势,中国科学院计算技术研究所研究员蒋树强认为,ChatGPT、Sora等依靠互联网数据训练的模型偏向“离身智能”,具身智能需要走进真实的物理世界,对从民生到航空航天的各类产业进行赋能,并对现实环境进行反馈,这就意味着千行百业都会有具身智能的用武之地。
与大模型的关联
在具身智能大会举办前一周,全球开发者先锋大会也在同一地点徐汇西岸举办。一周前的大模型讨论热度还未散去,具身智能的“新爆点”又接连亮相。具身智能与大模型之间,有怎样的关联?
卢策吾表示,相较把大模型视作具身智能的“大脑”,它更像是一种工具。“就像解决力学问题会用到牛顿定律,具身智能也会有自己的‘解决定律’,即自己的大模型。”但与大语言模型、视觉大模型不同的是,真实场景的训练成本很高,不可能像在数字世界那样24小时高速运转。因而具身智能大模型势必会有一套新的训练框架,而这正是卢策吾和他所在的上海交大团队正在研究的方向。
松灵机器人舒抒摄
当天大会,与会嘉宾提到,上一轮以ChatGPT、Sora等为代表的生成式人工智能,北美取得了较为明显的领先身位。但在具身智能领域,虽然我国的技术起步和浪潮涌现比北美稍迟了三年左右,但目前全球基本处于同一技术起跑线,都处在“爆发期开始前”。
在卢策吾看来,我国目前具备两大优势。其一是机器人硬件制造,其二是应用场景的数量和丰富程度。“仓储物流、食品加工、餐饮业和医疗服务业都陆续启用了具身智能,或许20年后,人们家中都会有家用养老机器人来照顾自己和家人,这些都是具身智能。”
如何将这些优势变成“盛世”,则需要产学研各界共同努力。
记者注意到,在具身智能大会的展示区,不少企业都搬出了“看家法宝”,包括能够流畅交流对话的客服机器人、适应复杂地形环境的四足机器人、匹配多种流水线作业的工业机器人等。装有AI大模型“大脑”的机器人可从事家政服务、养老陪护、教育医疗、设施巡检、抢险救灾等多种工作,展现具身智能在通用场景、专业领域、垂直工业等赛道的最新应用成果。
在上海傅利叶智能科技有限公司展台,一台泛着帅气金属光泽的深灰色机器人正在挥动手臂。这款机器人名为GR-1,即“General Robotics”通用机器人的缩写。现场工作人员介绍,目前企业聚焦机器人本体,从硬件结构到运动控制算法都具备了核心技术优势。
这款具身智能产品的“聪明劲”主要表现在两方面:运动能力和大脑交互能力。运动方面可完成跳、跑等动作,招手、行走和舞蹈也不在话下,可在不同场景下满足不同客户的需求。“我们开放接口,客户只需基于我们的平台去完成上层设计,就能让机器人完成相应的工作,在工业生产及教育等领域已开始应用。”
傅利叶通用人形机器人
更垂类领域内,咖啡机器人、冰淇淋机器人已经活跃在酒店、社餐等多个场景。上海乐白机器人有限公司销售总监廉文杰介绍,企业推出的七轴零售机器人、六轴协作机器人等在抓取3公斤以下的物品领域已具备核心技术优势。在万豪、全季等酒店餐厅,乐白的煮面机器人已经累计服务8800多天,深入人们的日常生活。
上海如何行动
上海是国内最早发力具身智能领域的先行者。去年印发的《上海市促进智能机器人产业高质量创新发展行动方案(2023-2025年)》就提出,将重点攻关具身智能等先进技术。上海市科委主任骆大进在会上表示,上海将加快推进具身智能、人形机器人等关键技术和底层技术的攻关突破,加快向具有全球影响力的科技创新中心迈进。
作为上海建设具有全球影响力科创中心的重要承载区,徐汇区近期打出了支持具身智能发展的“组合拳”,包括发布具身智能产业政策、与中国电科第二十一研究所共同打造上海具身智能创新中心,全区人工智能行业产值则突破了800亿元。
今年2月发布的《徐汇区关于加快推进具身智能产业发展的扶持意见(试行)》,是上海首个区级层面的具身智能产业支持政策。徐汇区副区长俞林伟表示,去年徐汇抓住大模型发展机遇,市区联手共建了全国首个、上海唯一的大模型创新生态社区“模速空间”,半年内首期2万平方米载体就迎来60余家企业和机构入驻。
模速空间舒抒摄
在此基础上,徐汇趁势追击,今年紧跟智能机器人升级换代、跨越式发展的战略机遇,在全市率先推出具身智能产业支持政策,围绕关键技术攻关、开放协同创新、高质量孵化器建设、拓展“具身智能+”应用、推动工业上楼等10个方面,支持人形机器人等智能终端及其应用领域的重大原创性科技创新,服务硬科技企业孵化成长。
“我们现在要攻克三个维度的挑战,即把供应链价格打下来、把市场占比提上来、把营收业绩提起来。”廉文杰提到的“三个小目标”,代表了不少人工智能中小型企业的真实想法:政府提供的阳光雨露充实了,企业负责努力茁壮成长就行。
记者注意到,徐汇此次发布的具身智能产业扶持意见,在资金支持的力度和支持领域的维度上有多处亮点,照顾到了不同规模的企业。如,对引领具身智能发展或取得颠覆性突破的项目,将给予最高1000万元支持,同样金额的支持也适用于取得一定商业成果的具身智能产品。对具有行业引领和示范效应的技术被应用于场景建设,或是符合“工业上楼”标准的数字化、智能化改造项目,徐汇也都将给予企业最高500万元的补贴。经认定的智造空间优质项目,则可享受最高3000万元市级专项补贴。
卢策吾表示,具身智能相关大模型、机器人产品的开发周期较长,需要政府部门对技术研发投入和起步阶段的开发团队给予更多扶持和关注。“‘everywhere is robot(处处都有机器人)’是一件投入很大的事情,但只要能跨过起步阶段这道坎,开始规模化,雪球就会越滚越大。”