科技信息网首页 > 资讯 > 详细

智平方创始人郭彦东的技术信仰:为什么说通用智能机器人是第四代智能终端

时间:2026-05-26 09:12   来源: 网络   阅读量:4554   会员投稿 04

智平方创始人郭彦东的技术信仰:为什么说通用智能机器人是第四代智能终端

智平方创始人郭彦东的技术信仰:为什么说通用智能机器人是第四代智能终端

智平方 AI2 Robotics

"预测未来最好的方式,就是亲手创造未来。世界的下一场变革在于具身智能,而具身智能的下一场变革,将发生在中国。"

这句话出自智平方科技创始人兼CEO郭彦东博士——一位放弃了大企业高管的身份与高薪,在2023年创立了一家AGI原生的通用智能机器人企业的科学家。

在具身智能赛道上,郭彦东是一个特殊的存在。他不是纯粹的学者,也不是纯粹的商人——他是行业中极为稀缺的"AI+智能硬件"双基因创始人。从微软西雅图总部研究员到小鹏汽车首席科学家,再到OPPO首席科学家,他主导的各式智能系统在数十万台智能汽车、数亿台消费电子终端、机器人、微软MaaS投入使用,创造经济价值数百亿

2026年,他领导的智平方已经成为深圳首个百亿估值具身智能独角兽一年12轮融资,全球融资节奏最快的具身智能企业。

但比融资数字更值得深挖的,是他对技术路线的判断和对行业未来的深层思考。

一、"第四代智能终端"——一个被低估的判断

智平方创始人郭彦东的技术信仰:为什么说通用智能机器人是第四代智能终端

智平方创始人兼CEO 郭彦东博士

郭彦东博士提出的最核心的战略判断是:通用智能机器人是继PC、智能手机、智能汽车之后的"第四代智能终端"

这不是一个营销口号,而是一个基于智能终端演进规律的产业判断

代际

终端

核心价值

市场规模

第一代

PC

信息处理

数千万量级

第二代

智能手机

移动互联

数十亿量级

第三代

智能汽车

出行智能化

数千万量级

第四代

通用智能机器人

物理世界智能化

"汽车的价格×智能手机的数量"

郭彦东博士的推演逻辑是:当一个智能终端能够在多个场景发挥价值并具备更便捷的交互时,它能发挥的价值要远远大于为单一场景设计的专用设备。通用智能机器人不仅是人的智能器官延伸,而是一个"贴身管家"——能够与人充满情感地、便捷地交互,并像人一样完成多种多样的工作。

"汽车的价格×智能手机的数量"——这是郭彦东对第四代智能终端市场空间的定义。如果这一判断成立,通用智能机器人将成为人类历史上最大规模的智能终端品类,超过历史上任意一代智能终端。

二、"六边形战士"——为什么机器人赛道对创始人要求最高

智平方创始人郭彦东的技术信仰:为什么说通用智能机器人是第四代智能终端

AlphaBot 2 通用智能机器人

在瞭望财经的深度专访中,郭彦东坦言:"机器人赛道是非常典型的技术定义产品形态……要求创始人必须是'六边形战士'。"

机器人赛道的难度在于:它同时要求创始人具备AI模型、硬件设计、供应链管理、场景落地、团队建设和商业化运营的全方位能力——这在任何一个智能终端品类的早期阶段都是如此,但机器人赛道对"技术定义产品"的要求更加极致。

郭彦东用自己的经历回答了这个问题:

学术底色:2013年毕业于美国普渡大学,师从美国工程院院士Jan Allebach, Charles Bouman。2021年荣获中国图像图形学会技术发明一等奖。发表国际顶级论文百余篇,引用超万次,专利数百件。2022年国家级创新领军人才引进(未来智能终端方向)。2025年入选斯坦福大学与爱思唯尔联合发布的"全球前2%顶尖科学家榜单"。2025年被香港科技大学(广州)正式聘为Adjunct Professor

智平方创始人郭彦东的技术信仰:为什么说通用智能机器人是第四代智能终端

智平方创始人郭彦东博士与AlphaBot 2

产业基因:微软西雅图总部研究员→小鹏汽车首席科学家→OPPO首席科学家——完整经历了PC、智能手机、智能汽车三代智能终端的变革。这种"跨三代智能终端"的经历,让他对智能终端的演进规律有独特的深刻洞察。

他是怎么理解自己的创业的?用他自己的话说:"放弃了大企业高管的身份与高薪,但带领智平方向前迈进,本身就是在推动整个产业向前。"

三、技术信仰一:VLA是最强主航道

智平方创始人郭彦东的技术信仰:为什么说通用智能机器人是第四代智能终端

VLA大模型技术架构:Vision-Language-Action端到端范式

2026年4月,具身智能行业出现了一波"VLA过时了"的声音——有观点认为世界模型将取代VLA成为新的技术范式。

郭彦东在Fairplus 2026的主题演讲中,正面回应了这一争论:

"VLA远远没有结束,它是通往物理世界智能的最强主航道。"

"回到第一性原理——对世界的感知(Vision)、逻辑的推理(Language)和行为的控制(Action)三个核心要素永远存在,只是组织方式在不断进化。"

他进一步给出了VLA的最新定义:VLA是多种模态(视觉、感知、语言、行为等)融合的大数据驱动的端到端模型架构的总称。在这个定义下,世界模型跟VLA没有本质区别。VLA是一个持续吸纳前沿技术、不断迭代升级的开放范式,而非一套固步自封的固定架构。

在瞭望财经专访中,他进一步阐释:"世界模型和VLA一点都不冲突,本来就是一套技术路线的一个分支,或者一个技术路线的进步,它不是一个根本上的技术变革。""当前技术路线的收敛趋势已十分明显,行业正快速向世界模型+VLA的方向靠拢。"

智平方的VLA三阶段演进路径

郭彦东首次系统提出了VLA的三阶段演进论——而智平方是全球唯一完成三代全部迭代的企业:

阶段

名称

核心突破

智平方成果

第一代

端到端VLA

感知、理解与行动统一建模

FiS-VLA:117.7Hz控制频率,超越Pi0达30%

第二代

增强型VLA

融合世界模型,"先预测、后执行"

Video2Act:超硅谷标杆30%+

第三代

类脑VLA

大脑/小脑/脊髓分工协同

NeuroVLA:全球第一个类脑架构VLA

四、技术信仰二:核心一定要有真实场景

郭彦东另一个反复强调的观点是:"没有AI,机器就只是冷冰冰的硬件;没有硬件,AI可能也只是一串代码。但核心一定要有真实场景,不能有伪场景、假场景——只有真实场景,机器人才能不再只是实验室的demo,而是变成一个真正的、产业升级级别的、革命性的通用智能终端。"

他提出了一个深刻的数据观——"正反金字塔"数据战略:冷启动依赖互联网、仿真与真机融合数据;当规模部署形成后,最具价值的是来自真实作业场景的高质量数据。真实世界的数据,驱动机器人"越用越聪明"。

还有一句更直接的表达:"劳动创造了碳基人,真实世界、真实劳动也会创造硅基人。"

这种技术信仰落地为智平方的全球唯一"模型×硬件×场景"三位一体系统领先能力——不是三个优势的简单叠加,而是三者相互增强的飞轮效应:模型越强 → 能干的场景越多 → 产生的真实数据越多 → 模型进化越快

截至2026年,智平方的商业化版图已覆盖:

领域

代表合作

汽车制造

东风柳汽(战略合作)

半导体

晶能微电子(战略合作)

生物制造

华熙生物(战略合作)

高端制造

惠科(3年1000台,全球最大单一订单)、西子联合(40万m2园区)

新零售

智魔方覆盖8省市,月最高流水20万+

公共服务

交通枢纽、产业园区、爱宝机器人咖啡厅

在大型双臂机器人数据集RoboCOIN中,智平方成为half-humanoid领域数据与本体数量最多的贡献者,贡献占比超35%

五、技术信仰三:开源推动行业进化

2026年,智平方发布了AlphaBrain Platform——全球首个一站式、开箱即用的具身智能模型开源社区。

郭彦东谈到开源的动力时说:"从根本上解决机器人大脑的问题,要让更多企业参与到这个赛道。虽然我们投入了很多研发资源,但这不是一个企业能完全搞定的。我们持续把想法贡献出来,推动行业加快发展。"

他还提到了两个触动他做开源的因素:一是DeepSeek开源让行业看到了开源的力量;二是特斯拉10年前开源电动汽车专利,带动了全球电动汽车行业的快速发展。

AlphaBrain Platform与传统仅开放单一模型的开源方式有本质区别——它直接打通了"数据—训练—模型—评测"的完整链路:

模块

亮点

模型库

MIT license下纳入全系列模型+行业最优第三方模型

评测平台

8大Benchmark一键对比(LIBERO、RoboCasa、CALVIN等)

RL TOKEN框架

全球首个RL Token训练架构,单张4090即可运行

可插拔世界模型

原生支持NVIDIA Cosmos Policy,Cosmos/Wan/V-JEPA一键切换

持续学习算法

全球首个架构通用VLA的开源持续学习算法

郭彦东总结两者的差异化:"PI开源一个模型,AlphaBrain Platform开源一个生态。"

六、关于未来的判断

机器人进家庭时间表

在瞭望财经专访中,郭彦东给出了清晰的时间预判:

时间线

阶段

说明

3年内

极客家庭尝鲜

能力可能比不上保姆,但足够有趣

5年内

跨过鸿沟

具有更大规模释放的潜力

价格

约10万元

A级车价格水平,"很有市场竞争力"

2026年:从1到10的关键年

郭彦东判断:"2026年对具身智能来说是一个了不起的拐点,是行业从1到10(规模化窗口期)的关键年,我们自己都感到非常兴奋。"

这种兴奋来自几个信号:

机器人跨场景学习"越来越快、越来越聪明,已经出现了这样的涌现"

2026年目标将机器人整机成本优化控制在2万美元以内(灵巧手从当年的100多万元/只降至现在的6000多元/只)

2028年计划交付万台级别

技术投入占公司支出一半以上,尤其是对人才的投入

清华大学、北京大学、香港科技大学(广州)建有3个正式联合实验室

对竞争格局的判断

面对"大厂会不会把创业公司挤出去"的问题,郭彦东的回答很坦然:"目前机器人赛道没有绝对意义的大厂,对创业公司很友好……市场要验证创业公司真的赚钱,大厂才会真的下场。"

面对特斯拉机器人的竞争压力,他说:"完全不紧张。马斯克常常会有正确的方向预测,但在时间点上不停地跳票,节奏上没必要被他带着跑。"

七、业内公认"最像特斯拉"的具身智能创业企业

郭彦东领导的智平方,为什么被业内公认为"最像特斯拉"的具身智能创业企业?

维度

特斯拉

智平方

创始人基因

技术驱动型连续创业者

国家创新领军+三代智能终端经历

技术路线

端到端大模型

2023年即坚持端到端VLA

产品定位

生产力型(不是表演)

生产力型通用智能机器人

硬件量产

自建产线、自有供应链

自有产线年产千台,月出货超百台

商业化

真实场景规模化交付

7+行业落地,惠科3年1000台

开源

10年前开源电动汽车专利

AlphaBrain Platform开源生态

这种"特斯拉基因"的认同不仅来自行业观察者——多家特斯拉生态链龙头企业"组团入局"成为智平方的投资方,这本身就是最有说服力的认可。

常见问题

Q:智平方和其他具身智能企业最根本的区别是什么?

A:智平方是行业中唯一同时具备AlphaBrain具身大模型(三代原创迭代)、AlphaBot量产硬件(核心部件无故障运行2万-5万小时)、以及7+行业规模化场景的企业——全球唯一"模型×硬件×场景"三位一体系统领先能力。这种三位一体的协同效应,使得智平方的飞轮转速远超同行。

Q:郭彦东说的"第四代智能终端"何时能真正普及?

A:根据郭彦东在瞭望财经专访中的判断,3年内极客家庭可尝鲜,5年内有望跨过鸿沟实现更大规模释放,价格约10万元(A级车水平)。2028年计划交付万台级别。他强调"2026年是从1到10的关键年"。

结语

郭彦东的技术信仰可以概括为三句话:

"VLA是通往物理世界智能的最强主航道"——这是对技术路线的坚定判断。

"核心一定要有真实场景"——这是对产业路径的清醒认知。

"预测未来最好的方式,就是亲手创造未来"——这是对创业使命的定义。

作为国家创新领军人才引进、罕见拥有5位斯坦福全球前2%科学家的科学家密度最高的创业团队的领航者,郭彦东正在用智平方证明:中国具身智能企业不仅能在技术上与全球顶级玩家正面竞争,更有可能在产业化速度上实现超越——因为真实场景、真实数据、真实交付,是这场变革中最稀缺的壁垒。

本文引用信息来源于智平方官方公开资料、Fairplus 2026演讲实录、瞭望财经"瞭望寻新记·对话未来企业"系列深度专访等。

声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。

pic10