前阿里千问技术负责人林俊旸近日在离职后发布深度分析文章,提出AI大模型领域正经历关键范式转移,技术竞争焦点已从"推理型思考"转向"智能体思考"。这一判断基于对OpenAI o1和DeepSeek-R1等代表性模型的观察,指出行业正从单纯扩大预训练规模,转向强化学习后训练阶段的规模化发展,数学推理和代码生成等可验证领域成为模型优化的核心场景。
文章详细拆解了"思考-指令混合模式"面临的实践困境。以千问团队开发Qwen3的经验为例,团队发现追求低延迟的指令模型与需要消耗大量计算资源的推理模型存在根本性冲突。这种矛盾在数据分布和优化目标层面尤为突出,不当的数据融合策略往往导致模型在两项指标上均表现不佳。基于商业客户对处理效率和成本控制的双重需求,Qwen2507版本最终选择推出分离的300亿参数指令模型和2350亿参数推理模型。
与国内团队的技术路径选择形成对比的是,Anthropic和DeepSeek等国际厂商仍在探索统一架构下的推理与工具调用融合方案。这种差异反映出不同市场环境下对模型架构的多样化探索,既包含对技术可行性的验证,也涉及商业落地的权衡考量。
对于技术演进方向,林俊旸强调传统通过延长推理链提升性能的方法即将触及天花板,未来主流将是具备环境交互能力的智能体架构。这种转变要求重新构建技术栈,实现训练与推理环节的深度解耦。随着模型逐步接入搜索引擎、代码执行器等外部工具,如何防范奖励函数被恶意利用成为关键安全挑战。他特别指出,行业竞争优势将不再局限于算法创新,而是转向环境构建、安全协议设计以及多智能体协作等系统性工程能力建设。















