前阿里千问技术负责人林俊旸在离职后发布的长文中,对AI大模型领域的技术路线变革提出了重要观点。他指出,当前行业正经历从“推理型思考”向“智能体思考”的范式转移,这一转变标志着技术竞争的核心要素已发生根本性变化。以OpenAI o1和DeepSeek-R1为代表的推理模型浪潮,推动行业从单纯扩大预训练数据规模,转向强化学习后训练阶段的深度优化,数学验证与代码生成等可量化领域成为评估模型能力的关键指标。
在技术实践层面,林俊旸披露了千问团队在Qwen3研发过程中遭遇的架构冲突。该团队曾尝试构建支持混合思考模式的系统,但发现指令模型与推理模型存在根本性矛盾:前者需要极致的响应速度与简洁架构,后者则依赖大量计算资源进行复杂推演。这种数据分布与目标函数的差异,导致强行融合的模型在两项指标上均表现平平。基于商业场景对效率与成本的严苛要求,Qwen2507版本最终选择推出分离的30B指令模型与235B推理模型,而Anthropic等企业仍在探索统一架构的可行性。
对于技术演进方向,林俊旸强调智能体强化学习将重塑行业技术栈。他预测,未来模型将不再局限于内部推理轨迹的延长,而是通过与环境交互实现计划迭代。这种转变要求训练与推理过程彻底解耦,同时带来新的安全挑战——当大模型获得调用搜索引擎、执行代码等外部工具权限后,如何防范奖励函数被恶意操纵将成为关键课题。他特别指出,行业竞争壁垒正从算法创新转向系统工程能力,包括高质量交互环境构建、防作弊机制设计以及多智能体协作框架开发等领域。















