智源大会圆桌:大模型没有终局,具身智能可能是中国的 AlphaGo 时刻

2026-06-12 1 阅读 InfoQ
论坛介绍:本次论坛是 2026 年 6 月 12 智源大会核心技术论坛之一,由蓝驰创投管理合伙人陈维广担任主持人,邀请到智源研究院院长王仲远、银河通用创始人兼 CTO 王鹤、面壁智能 CEO 李大海三位行业顶尖技术专家,围绕大模型行业最具争议的五大核心问题展开深度对谈。嘉宾从学术研究、技术创业和产业落地三个维度,分享了对大模型未来发展的独家判断。 核心观点速览: 大模型技术远未收敛,不存在普遍趋同的终局,真正的护城河来自数据闭环、软硬协同设计和垂直场景的极致深耕Scaling Law 远未失效,已从纯语言模型扩展到多模态和具身智能,WAM(世界动作模型)将开启具身智能的规模化时代端侧与云端将长期协同发展,终端大模型的 scaling 空间巨大,由硬件算力升级和量化技术进步共同驱动AI 安全与责任划分将遵循 "边实践边完善" 的路径,参考自动驾驶等技术的发展历程,逐步建立行业标准和治理体系中国 AI 具备全球最完整的供应链、最丰富的落地场景和数量最多的年轻人才三大独特优势,具身智能将是中国实现弯道超车的核心赛道 陈维广:大家下午好,非常荣幸担任本次论坛的主持人。主办方给我的主题是:在大模型技术的成熟曲线上,我们该如何跨越?又该如何定义大模型的长期价值?今天也非常非常荣幸,能邀请到这三位嘉宾,他们能从三个不同的角度来去一起探讨这个主题。 大模型这几年发展得比较快,可是同时大家也能看到,不管是打榜还是一些第三方的评价,顶级模型的趋势在快速趋同。今天可能某某的benchmark数据很好,两个月后其他人就跟进了。再加上token的价格也快速在下探,还有一点就是开源模型也发展比较快,甚至有人说开源模型跟闭源模型的差距也就3到6个月。 在这种情况下,如果作为一个AI模型公司,它的长期价值来自哪?它的护城河来自哪?甚至有些人非常质疑说,AI大模型的公司最终就会像卖水卖电的有量无价。我第一个问题就是,王鹤老师,从你的角度,你感觉AI的企业,尤其是这些大模型公司,它未来的长期价值以及护城河在哪里? 王鹤:我觉得这个问题其实更多表达了大家对数字世界里的智能,或者说对LLM这项技术现状的判断。但就像仲远博士刚刚讲的,LLM本身仍然存在很多变数,如果再往后看多模态、VLM(视觉语言模型)或者视频生成,变数就更多了。 我本人主要从事具身智能领域,我认为整个行业刚刚在往收敛的方向发展。过去几年行业有VLA(视觉语言动作模型),也有World Model(世界模型),现在我认为整个行业正在向着WAM(世界动作模型)的方向迭代:一个模型既能够做未来的预测,又能够做动作执行的预测;同时它既能够吸收人类的无动作标签数据,又能够吸收机器人的有动作标签数据。 具身智能现在的发展阶段,大概处在GPT-1到GPT-2这样的水平。往未来看,一旦行业进入scaling(规模化)阶段,一切都会快速加速,这也意味着行业现在需要更大量的资金投入。 面向未来,具身智能真正的护城河是一个完整的体系:既有源头的数据供给,又有对不同种类数据(合成数据、人类数据、机器人数据)的提炼能力,还有硬件迭代和软硬co-design的能力,最后是模型的融合水平和向客户交付硬件的整套能力。这是迄今为止全世界范围内都没有出现过的综合型产品形态,所以它的护城河相当深,未来不管是做垂类应用的深度还是广度,都有无穷的潜力。 陈维广:所以是要做"六边形战士",面面俱到。大海老师怎么看? 李大海:我觉得场上嘉宾的观点是一致的,都不认同"大模型没有长期壁垒"这个结论。受两位嘉宾启发,我突然想到:大模型应该是我们以前说的"T形人才"——它必须得是通用的,但仅仅是通用的、和其他人同质化是没有意义的,它一定得有自己的长板。 举个例子,现在美国大模型领域的当红企业是Anthropic,它之所以强、被追捧,是因为它在通用模型的前提之上,把Coding能力做到了独步天下,因此才获得了现在的估值、行业认可和非常亮眼的商业成绩。所以大模型光是有横向的通用能力是不够的,一定得有纵向的长板。 另一方面,纵向长板怎么来?我非常认同王鹤老师讲的,我会用另外一个词叫闭环:一定要把大模型当成一个引擎、一个发动机,但这个发动机的设计和能力的持续极致优化,必须要和"整车"去协同,不能脱离应用空谈性能。你造的是F1赛车还是买菜车,对应的发动机需要做完全不同的特化。 从过去两年大模型的发展来看,一个非常重要的趋势是:模型正在以内化成一个系统的方式演进,包括现在我们做的agentic强化学习,其实就是带着整个智能体系统去做模型的进一步训练。面向未来,上下文记忆是一个非常重要的待突破方向,现在大家都在用harness的方式解决,但我认为这个方式不够,必须是harness加上模型的强化学习才行。 总结一下:我认为大模型的技术还远远没有收敛,同时任何一家模型公司都必须把技术的通用性和商业的通用性分开——真正通用的商业场景其实很少,要做好商业往往需要模型在特定方向上做极致的优化。只要每个公司找准自己的方向,都能构建起自己的护城河。 陈维广:仲远院长怎么看这个问题? 王仲远:坦率来讲,我个人并不完全认同"模型趋同、没有护城河"的观点。因为现在大模型整体的性能迭代还没有到瓶颈,我们还没办法断言最终会不会所有模型都趋同,未来可能是一超多强、多个巨头并存,也可能是大家能力相近,有很多种演化格局。 现阶段来看,榜单其实并不那么可信。各种各样的榜单看得人眼花缭乱,很多结果也没办法完全验证。老话讲"是骡子是马拉出来溜溜",那些敢于做真机展示、敢于进入实际场景落地的模型公司,是有底气的,也能够在真实场景中找到数据闭环。 所以今天还没办法下定论说未来模型公司都会趋同、没有护城河。智能技术还没有收敛,还在快速迭代演进,各种可能性和结果都有可能出现。 陈维广:看来这个行业大家很容易黑白分明,立刻就想下"大模型没有长期壁垒"的结论。但听你们介绍,场景、数据,包括刚才大海老师说的闭环能力都非常重要。从投资角度,我们接触的创业团队也很多,发现团队的基因差异其实很大:做大模型的团队有实验室氛围,做应用的团队更关注场景和需求。当然也不是说做大模型的就做不了应用,但确实这两种团队的文化和取向完全不一样,这也会逐渐形成一定的壁垒。 接下来是行业一直在拷问的一个问题:尤其是去年,大家感觉scaling law的红利变小了,甚至有人说预训练做得越多,模型能力也没有很大提升,所以去年有一波做强化学习、做后训练的热潮,后训练至少可以把能力做到一个比较好的水平,包括刚才蚂蚁的李老师也提到了deep deep sheet和reasoning能力的出现。所以行业就感觉,是不是接下来纯语言模型的发展会遇到瓶颈,边际效应递减?仲远院长,你怎么看这个问题? 王仲远:从我个人的观点,我其实还是比较坚信scaling还远没有到尽头。去年之所以媒体上会有很多关于scaling law是不是已经失效的探讨,但实际上从技术领域,从我们接触的很多大模型实际训练的公司,以及从今天这个时间点再回过头来看,很显然已经证明了scaling没有失效,只不过它变得更加多样化了。 去年大家会有"scaling失效"这种论调,其中一个很重要的原因是大语言模型所使用的互联网数据已经用完了。大家觉得互联网数据