在中关村国际创新中心举办的论坛上,一场关于大模型技术演进的讨论引发行业关注。这场汇聚了月之暗面创始人杨植麟、智谱CEO张鹏、无问芯穹创始人夏立雪等核心玩家的对话,揭示了以OpenClaw为代表的Agent技术正在重塑行业格局。与会者普遍认为,大模型已从"问答机器"进化为"任务执行者",这一转变正在催生全新的技术范式与商业逻辑。
技术突破的直观体现是任务处理方式的根本转变。张鹏将OpenClaw类比为"数字脚手架",指出其核心价值在于将复杂任务拆解为可执行的子模块。这种转变使得普通用户无需编程技能即可调用顶级模型完成工作,例如自动生成商业报告或进行市场分析。系统不再局限于单轮问答,而是通过规划-执行-修正的循环,在多轮交互中逐步逼近最优解。这种迭代过程虽然增加了响应时间,却显著提升了任务完成质量。
行业数据印证了这种转变的深度。夏立雪透露,其公司处理的Token用量自1月底起呈现指数级增长,每两周翻一番的态势迫使基础设施层进行架构革新。在Agent场景下,单个任务的Token消耗可达传统问答的百倍,这种消耗模式倒逼厂商重新设计计费体系。当Token从成本指标转化为"机器工时"计量单位时,价格开始与任务价值挂钩,形成新的市场定价基准。
技术竞赛的焦点随之转移。随着任务复杂度提升,模型处理的Context长度突破百万级甚至千万级token,这促使厂商在推理侧展开结构创新。小米MiMo团队负责人罗福莉指出,Hybrid架构、Linear Attention等新技术正在解决长上下文处理中的成本与稳定性难题。这种转变意味着竞争维度从参数规模下沉至推理效率,能源成本甚至成为新的比拼焦点。
系统能力的提升正在弥合模型间的性能差距。黄超教授观察到,通过Skill组合与工具调用,次顶级模型在复杂任务中的表现已接近最新模型。这种变化促使用户关注点从模型指标转向任务结果,构建门槛随之降低。罗福莉强调,中国团队在算力受限时期培养的效率优化能力,正在长上下文处理场景中发挥关键作用。例如DPCV3等创新结构,在低端算力下实现了推理成本与速度的平衡。
商业层面的调整同样显著。智谱新发布的GLM Turbo模型专门针对任务执行场景优化,其多智能体协同架构使Token消耗效率提升数倍。张鹏坦言,提价是回归商业本质的必要举措,当任务处理的Token消耗达到传统问答百倍时,维持低价将阻碍技术迭代。这种调整在小米身上得到印证,其开源的MiMo-V2-Pro模型通过社区协作快速迭代,在OpenRouter平台上的调用量已登顶榜首。
这场变革正在重塑行业生态。杨植麟指出,OpenClaw的开源特性激发了社区创新,次顶级模型通过Skill体系既能保证任务下限,又能逼近最新模型的上限。这种设计点燃了行业想象力,更多非技术人员开始参与AGI变革,将重复性工作交给Agent处理。当技术门槛降低后,如何设计更高效的工具组合与任务分解机制,成为新的竞争焦点。















