“买了一款人形机器人,训练它做家务。但现实很残酷,在打碎八个盘子后,它竟围着一堆碎片跳科目三。”
2025WAIC展台,当人们见识了机器人蹦迪、360度旋转跳等酷炫动作后,又不免生出机器人不够务实、“高能低智”的抱怨。
2025WAIC上的机器人格斗
痛点即机会。国家地方共建人形机器人创新中心(以下简称“国地中心”)首席科学家江磊日前在2025WAIC上做出明确判断:“机器人的‘走跑跳’能力,中国企业可以挺起腰杆说,我们超过了特斯拉、波士顿动力。但接下来,机器人‘能干活’才是真风口。”
知名投行摩根士丹利近期首提全球人形机器人领域上市公司100家,其中70%集中于中美两国,中国公司有37家。目前从全球看,在推动人形机器人走向强技能且脑子灵光的道路上,相关技术路线尚未完全收敛。这也意味着,站上“能干活”风口的机器人胜者,大概率会在中美间产生。
今年5月,2025张江具身智能开发者大会暨国际人形机器人技能大赛上,机器人参加叠衣比赛。
AI能写诗却无法执杯?
AI能下棋写诗,却很难稳稳拿起玻璃杯。仅仅为训练机器人洗衣,特斯拉就砸了20亿美金。
其中原因,包括但不限于:语料贵。具身智能依赖的与真实物理世界的交互数据,其获取难度远高于图像、文本;模仿难。大模型现能模仿的人类手部精细动作只有200个,远低于人类手臂手腕手指数十关节协同下能完成的复杂操作数量;硬件拖后腿。如行星滚柱丝杠等机器人灵巧手关键驱动部件,仍高度依赖定制。
国内灵巧手企业诺仕机器人创始人徐杨有一形象比喻:软件上,就算你有林丹的大脑,但你的手臂、肌肉等硬件如果不支持大脑执行,还是白搭。
其实,洗衣这件事,明明洗衣机就能解决。特斯拉之所以重金教机器人洗衣,真正用意在于“泛化”,即以大数据、大算力、大模型来修炼机器人,使其生长出烧饭叠衣、装配修理、保洁照护等样样在行的复合能力。
据记者了解,国地中心研发的全尺寸开源公版人形机器人“青龙”就曾在延锋汽车产线上“实习”,尝试上下料。近期,美国人形机器人企业Figure也发布了其机器人分拣快递的视频。
美国人形机器人企业Figure发布其机器人分拣快递的视频
但国地中心研发总监邢伯阳道出实情:实际下场时,要面对的挑战非常多。“我们看到许多机器人在单一工位能出色完成任务,但真正的应用场景,需要它具备至少五种技能,且在一个广阔的厂房空间内,实现四五个工位的转移。”
智澄AI创始人胡鲁辉还无情补充:“不仅任务要泛化,还有环境泛化,即我的机器人既能在家干活,换个家也能干活!”
中美同一起跑线较量
因此业内普遍预计,人形机器人真正具备合格泛化能力,以应对“既要又要还要”需求,至少在2030年后。这一过程中,机器人主导决策的“大脑”、负责执行的“小脑”,以及“肢体”,三者须协同共进。
此次WAIC上,上海矩阵超智公司的新一代人形机器人MATRIX-1进行了全球首次动态演示。在餐饮场景中,MATRIX-1听到“餐桌撤台”指令后,会先撤倒餐具内污物,再收纳餐具、清洁桌面、摆椅子。此长程任务中,序列规划与动作执行井井有条。另外,凭借多模态感知与空间推理认知能力的突破,MATRIX-1的自研五指灵巧手拥有22个自由度,可精准完成物体抓取、抓握、捏取、拧取、旋转、递物等精细操作,并保持毫秒级响应延迟。公司独创的少样本迁移技术,可确保单次少样本数采后训练,即可泛化迁移至80%相似场景。
2025WAIC上,上海矩阵超智公司的新一代人形机器人MATRIX-1进行了全球首次动态演示。
矩阵超智的优势,在于其“大脑-小脑-肢体协同”AI操作系统,确保机器人像人类一样看到、思考并行动。据悉,矩阵超智于去年4月成立,MATRIX-1原型机的研发用时仅132天,公司创始人张海星系原特斯拉中国设计中心负责人。目前,矩阵超智已进入软硬件协同优化与量产冲刺阶段,来自海内外客户的人形机器人意向订单达近千台。
另据记者了解,旨在实现具身智能大小脑及肢体协同的模型架构,目前全球基本形成共识,即VLA(视觉-语言-动作)模型。该模型2023年由谷歌旗下DeepMind率先提出。此后,Figure、Pi、英伟达等美国公司,以及国内的星动纪元、银河通用、智元机器人等,也相继致敬VLA架构,并基于此架构再行开发。
美国Figure公司的Helix、中国星动纪元的ERA 42模型,都基于VLA,但训练与任务泛化效率不同。
不过在这种共识中,中美之间也互有借鉴。如星动纪元在VLA架构强调“慢思考”的基础上,增加了高频动作处理模块,于2024年底发布其融合理解与生成式的VLA模型ERA-42,可实现对世界的深度理解及实时预测。如杯子放在桌面边缘,机器人会“担心”它掉下去。
星动纪元CEO陈建宇不无骄傲,在他发布ERA-42模型前后,美国Pi、Figure等同行也发布了类似架构的VLA模型,真可谓英雄所见略同。
记者获悉,同样基于VLA架构,各家模型的训练与泛化效率各不相同,但中国公司的创新策略,往往使效率数倍于美国公司。英伟达CEO黄仁勋日前在2025CES(国际消费电子展)的一场主题演讲中,展示他看好的14款人形机器人,其中近半数为中国企业,包括智元、傅利叶、星动纪元、银河通用等。
“能干活”仍要迈不少槛
“几乎每周,我们都能收到一两位顶级学者、大咖的信息,说要做具身智能。有归国的华人科学家,有来自中国顶尖大学的专家,又或是从相关产业出来的技术牛人。”启明创投主管合伙人周志峰近期的感受尤为强烈。他说:“当我们问他们为何仍要选择入场时,多数创业者给出的答案高度一致:具身机器人是人类在基因中的梦想。”
这家知名投资机构很早就投了优必选,由此成就国内“人形机器人第一股”。但这并不妨碍它在巨大机会面前又布局数家新的机器人公司,其中包括创下中国具身智能行业天使轮最大融资额纪录(1.2亿美元)的它石智航。
它石智航创始人陈亦伦(中)参与2025WAIC,创下中国具身智能行业天使轮最大融资额纪录
具身智能尤其是人形机器人,被视作继智能手机、新能源汽车后有着万亿市场规模的超级应用。但火热背后,江磊选择冷静。他认为,人形机器人“能干活”,关键在于解决感知局限、决策断层、泛化瓶颈。
而聚焦这三大痛点过程中,数据作为具身智能认知真实物理世界、提升操作精度的关键语料,乃重中之重。据记者了解,上海作为规模约占全国三分之一的机器人产业高地,在解决数据难题上,走的是“众人拾柴”模式——由国地中心搭建,今年1月,全国首个异构人形机器人训练场在张江模力社区启用,已部署102台异构人形机器人,实现对数据的规模化收集与生产。
今年1月,全国首个异构人形机器人训练场在张江模力社区启用。
江磊透露,谷歌作为全球具身智能数据大户,过去5年已采集300万条数据。“但今年年内,我们训练场有望完成500万条真机数据采集,成为全球最大的具身智能数据集聚地。”国地中心还联合上海机器人企业、国地中心分训练场,以及上海人工智能实验室、华为云等单位,构建人形机器人训练场合作生态,正联合打造近2500万条真机数据池。
=2025人形机器人与具身智能创新发展论坛上,国地共建人形机器人创新中心训练场合作生态签约。
人形机器人是有身体的AI,不应只关注AI而忽略身体。从整个产业链来看,具身智能的关键硬件,已从感知、控制、驱动、传动“老四大件”,迈向高端芯片、动力电池、高性能材料,连接器/标准器“新四大件”,以及感知头、灵巧手、机械臂、电子皮肤“新四大组件”。
“我跟许多传感器企业说,我们做人形机器人的,多么希望能直接用到感知头,而非视觉传感器;直接用灵巧手,而不是应变片传感器。我们能不能为人形机器人打造出新的组件来?”
江磊的发问,同样既是痛点,也是机会。
红腾网配资-查配资炒股-配资开户平台-杠杆买股票提示:文章来自网络,不代表本站观点。