【观察】
物理AI的崛起与端侧算力的范式跃迁
——基于倪光南院士最新论断的逻辑梳理与点滴思考
2026年5月28日,以“智行天下 能动未来”为主题的2026世界智能产业博览会暨第三届京津冀智能制造装备协同发展大会在天津启幕。在这场聚焦智能科技与高端制造的行业盛会上,中国工程院院士倪光南在接受采访时指出,物理AI(Physical AI)的发展将对算力产业产生显著的促进作用。在未来的算力版图中,除传统的中心算力外,端侧算力的发展需求和市场潜力将表现得更为突出。这一重要论断不仅引发了业内对算力经济模型的重新评估,也倾向于为智能产业“从虚向实”的拐点提供一份清晰的逻辑参照。
我们认为,理解物理AI的崛起及其对端侧算力需求的结构性重组,通常需要我们回到信息科学、复杂控制论与新质生产力发展的客观规律中去进行尝试性探讨。
一、从生成虚拟到重构世界:物理AI的认知跨越
在人工智能技术经历了一轮以大语言模型(LLM)为代表的“文本爆发期”后,AI产业正迎来从虚向实的关键转折。传统生成式AI通常基于统计概率预测,在虚拟的信息空间中进行内容生成与逻辑拼凑。然而,当技术试图向物理世界延伸时,这种概率性预测的局限性便倾向于暴露出来。
倪光南院士在此前关于生成式AI的发展研判中指出,当前的生成式AI仍处于发展初期。以一些备受瞩目的文生视频应用为例,虽然它们能够生成高度逼真的连续图像,但在很大程度上还无法准确模拟复杂物理场景的动力学特性,也难以真正理解物质实体之间的因果逻辑。例如,在模拟液体泼溅的动态过程时,现有的视频大模型可能仅能生成起点与终点的静止或半稳定状态,而最复杂的流体运动过程却可能缺失。这说明,要实现智能体在真实世界中的自主交互,仅靠公网文本或概率像素的生成是远远不够的,通常需要将科学定律、物理约束与计算能力进行深度的融合。
在这一演进过程中,视觉被普遍视为智能的起点。倪光南院士曾引用图灵奖获得者杨立昆(Yann LeCun)教授的数据指出,一个典型大语言模型学习的互联网全部公开文本信息量,大约在10^14字节,需要一个人花费几十万年才能学完;而一个四岁的孩童,通过眼睛观察外部物理世界,在四年中获取的视频信息量也大约在10^14字节。这一事实在很大程度上佐证了,人类对客观世界的认知高度依赖多模态的视觉环境感知。因此,物理AI的发展核心不倾向于单纯的“生成”,而在于通过“空间计算”对物理世界进行结构化重构,从而在大模型与三维空间之间架起一座确定性的桥梁。
二、脑、眼、行动一体化:具身智能系统的重构
物理AI在生产与生活场景中的具身化表现,基本指向了智能机器人与端侧自适应设备。传统的工业机器人通常属于执行预设脚本的“自动化工具”,而在新型工业化(工业5.0)的转型浪潮中,机器人正逐步向具备自主决策能力的“智能化主体”转变。为了实现这一范式跃迁,倪光南院士提出了构建机器人“脑、眼、行动”一体化具身智能系统的系统构想:
其一是“脑”:即基于大模型的机器人大脑。它使其能够接收非标准的自然语言指令,执行模糊意图解析、任务自适应规划,并灵活适应不同的物理工作场景需求。
其二是“眼”:即高性价比的三维空间感知系统。倪光南院士主张采用“AI+空间计算”的技术路线,通过普通的单目摄像头结合神经网络学习,实现高性价比、高精度的三维视觉感知,精准识别物理实体的几何边界与拓扑位置。
其三是“行动”:即底层的物理驱动与运动控制系统。为了实现机器人本体(手、脚、轮子)的高效协作,通常需要一套中立、标准且高度稳健的操作系统(如由中科院软件所支持的开源机器人操作系统AgileROS)作为行为载体,通过开源协同、软硬解耦来保障智能的平滑传递。
我们认为,这一“脑、眼、行动”一体化架构的建立,正在重塑数字世界与物理世界的关系。它不仅推动了控制方式从传统的实时操作系统向具身智能系统的演进,也使得智能设备能够在无需固定工件、不依赖预设航线的前提下,将作业精度和自适应性提升到工业级甚至更高水平。
三、算力重心转移:端侧算力龙头的崛起与潜在规模
具身智能和物理AI的快速落地,必然伴随着算力产业经济模型的深刻变革。在上一阶段,由于模型参数庞大且训练需求集中,算力资源呈现高度“云端化”与“中心化”特征。然而,当智能体需要与物理世界进行高频、实时的微观交互时,云端算力的局限性便开始显现。
在大会采访中,倪光南院士对未来的算力需求结构给出了极具前瞻性的论断:
中心算力是很大,但是数量少。而端侧上的每个机器人、物理AI机器人,将来你关心的不仅是关节多少,还有它用什么大模型,运行模型的效率。所以,端侧算力的发展需求,将来有可能和这个中心算力的需求同等规模,甚至更大。” —— 倪光南院士接受采访时的原声转录
基于目前信息研判,这一观点深入剖析了边缘计算在物理世界中的物理学与经济学约束。我们认为,中心算力虽然在处理超大参数、超长上下文的宏观归纳任务时具备垄断性优势,但其在传输带宽、网络延迟、能效比以及最敏感的数据主权保护上,天然存在物理学上限。相反,端侧算力通过将微调模型(如SLM、量化开源模型)部署在设备的物理控制边界内,能够实现极低的延迟响应(通常在50毫秒以内),这对于高速移动作业、工业锁付、零容错控制等涉身安全场景而言,在很大程度上属于刚性需求。
此外,这种范式跃迁倾向于重新定义智能设备的评估标准。未来的智能终端,其核心竞争力不排除从单纯的机械控制能力(如关节数量、传动精度)转向其端侧芯片对大模型的调度效率和推理能效比。随着千亿级泛在物理节点的铺开,端侧算力市场的长尾规模大概率将与云端中心算力并驾齐驱,甚至在数据重力与隐私防线的双重作用下,展现出更强的反脆弱性与自生长能力。
四、共建新生态:开源芯片架构与机器人系统的协同
在构建“脑、眼、行动”一体化的物理AI新体系时,如何打破技术壁垒、维护生态的自主性与中立性,是决定未来产业走势的关键。倪光南院士类比了信息产业历史上的两次重大联盟:个人电脑时代的“Wintel联盟”与移动互联网时代的“ARM+Android联盟”。他认为,在AI与物理智能交互的时代,中国产业界应积极谋划并推动基于开源芯片架构(如RISC-V)与开源操作系统(如AgileROS)的新生态建设。
我们认为,开源生态的建设在某种程度上能够消除因单一厂商技术锁定而产生的结构性内耗。通过将底层的“交通规则”(数据传输格式、意图解释协议)公开,不仅可以吸引全球冗余生产力(独立开发者与创作者)的加入,还能够赋能广大中小型企业以极低的门槛获取“智能红利”,从而将技术成果转化为新质生产力,推动数字经济的普惠发展与健康流动。
综上所述,物理AI的崛起与端侧算力的爆发,正在重塑我们与数字世界的交互范式。面对这场悄然发生的范式跃迁,保持理性的技术主权意识,坚持在受限环境下打磨极致的性能与合规防线,大概率能让智慧在离线边缘处涌现,为建设科技强国提供实事求是的自主底座。