阿里前最年轻P10、千问系列核心操盘手林俊旸的离职,在AI行业引发连锁反应。这位曾带领团队将Qwen模型推向全球开源巅峰的技术领袖,在社交媒体发布长文阐述AI发展新路径后,其职业轨迹与行业洞见成为焦点。这场始于组织架构调整的离职事件,意外揭开了大模型时代向智能体时代转型的深层矛盾。
林俊旸主导的Qwen系列曾创造行业奇迹:全球下载量突破10亿次,衍生模型超20万款,在GitHub形成庞大开发者生态。但阿里内部关于技术路线的分歧最终导致其出走——管理层主张将预训练、后训练等模块拆分重组,而林坚持垂直整合的研发体系。这种分歧本质上是AI发展路径的抉择:当行业从"训练模型"转向"训练智能体",组织架构与工程体系必须同步革新。
在长文中,林俊旸系统梳理了AI思考范式的演进。他指出,OpenAI o1与DeepSeek-R1验证了"推理式后训练"的可行性,通过强化学习让模型掌握"思考前先推理"的能力。但2025年行业陷入"让模型想更多"的怪圈,过度追求推理链长度而忽视实际应用价值。Qwen3的实践表明,强行融合思考与指令模式会导致模型性能折损,商业客户更倾向选择专注指令优化的专用模型。
智能体时代的到来正在重塑技术评价体系。林俊旸强调,传统闭卷考试式的推理评估已失效,新标准应聚焦模型在真实环境中的持续行动能力。这要求AI系统具备动态决策、工具调用、环境感知等复合能力,其核心挑战在于构建高质量训练环境——环境稳定性、场景覆盖度、反馈信号质量成为关键竞争要素。
行业已出现路线分化:Anthropic通过Claude系列探索可控推理预算,将编程质量与工具使用置于首位;GLM-4.5与DeepSeek V3.1则尝试混合推理架构。林俊旸认为,真正的突破在于建立"思考-行动"的闭环系统,这需要解决奖励劫持、环境信息泄露等新问题。他预言,下一代AI竞争将聚焦于系统工程能力,包括多智能体协调、训练推理一体化等基础设施创新。
这场范式转移正在改写技术权力格局。当智能体成为核心载体,模型架构的重要性相对下降,环境构建能力上升为战略资产。开发者需要重新思考:如何设计让模型在行动中学习的训练框架?怎样防止智能体利用工具作弊?这些问题的答案,将决定谁能主导AI的下一个黄金十年。















