小米在大模型领域取得重大突破,其自主研发的MiMo大模型调用量于近日突破1万亿Token大关,标志着小米在人工智能赛道上迈入新阶段。这一里程碑式进展由小米集团CEO雷军通过社交平台对外公布,引发行业广泛关注。
回顾小米大模型发展历程,2023年4月该公司开源了首个专为推理优化的Xiaomi MiMo模型,同年12月推出迭代版本MiMo-V2-Flash。今年3月,面向智能体(Agent)时代打造的旗舰基座模型MiMo-V2-Pro正式问世,该模型总参数量突破1T规模,其中激活参数达420亿,较前代扩大近三倍。技术架构方面,新模型延续了Hybrid Attention混合注意力机制,将混合比例从5:1提升至7:1,同时支持处理长达100万字符的超长上下文。
在性能评估中,MiMo-V2-Pro展现出强劲竞争力。第三方基准测试显示,该模型在代码生成、通用任务处理及工具调用等核心能力上,已与Claude Sonnet 4.6、GPT 5.2、Gemini 3.0 Pro等国际主流模型处于同一水平梯队。这一成果验证了小米在垂直场景优化方面的技术积累,特别是在高强度智能体工作场景中的适应性。
作为人工智能时代的关键资源,Token(词元)正取代传统流量成为衡量模型效能的核心指标。每个用户输入字符、模型生成内容及图像识别过程,都会产生相应的词元消耗。小米此次公布的万亿级调用量数据,不仅反映其技术产品的市场渗透率,更凸显大模型在智能终端、云计算等领域的规模化应用潜力。
据技术团队介绍,MiMo系列模型采用动态参数分配策略,通过优化计算资源调度实现效率提升。这种设计使得模型在保持高性能的同时,能够有效控制硬件成本与能耗,为移动端设备部署大规模AI模型提供可行性方案。随着调用量的持续增长,小米正加速构建覆盖手机、IoT设备及云端服务的智能生态体系。















