林俊旸离职后发声：复盘千问困境，称AI大模型将全面迈入智能体思考时代

发布时间：2026-03-27 12:02 来源：快讯作者：周伟

前阿里千问技术负责人林俊旸在离职后发布的长文中，对AI大模型领域的技术路线变革提出了重要观点。他指出，当前行业正经历从“推理型思考”向“智能体思考”的范式转移，这一转变标志着技术竞争的核心要素已发生根本性变化。以OpenAI o1和DeepSeek-R1为代表的推理模型浪潮，推动行业从单纯扩大预训练数据规模，转向强化学习后训练阶段的深度优化，数学验证与代码生成等可量化领域成为评估模型能力的关键指标。

在技术实践层面，林俊旸披露了千问团队在Qwen3研发过程中遭遇的架构冲突。该团队曾尝试构建支持混合思考模式的系统，但发现指令模型与推理模型存在根本性矛盾：前者需要极致的响应速度与简洁架构，后者则依赖大量计算资源进行复杂推演。这种数据分布与目标函数的差异，导致强行融合的模型在两项指标上均表现平平。基于商业场景对效率与成本的严苛要求，Qwen2507版本最终选择推出分离的30B指令模型与235B推理模型，而Anthropic等企业仍在探索统一架构的可行性。

对于技术演进方向，林俊旸强调智能体强化学习将重塑行业技术栈。他预测，未来模型将不再局限于内部推理轨迹的延长，而是通过与环境交互实现计划迭代。这种转变要求训练与推理过程彻底解耦，同时带来新的安全挑战——当大模型获得调用搜索引擎、执行代码等外部工具权限后，如何防范奖励函数被恶意操纵将成为关键课题。他特别指出，行业竞争壁垒正从算法创新转向系统工程能力，包括高质量交互环境构建、防作弊机制设计以及多智能体协作框架开发等领域。

更多>同类内容