在近期的小米“人车家全生态大会”上,备受瞩目的“天才少女”罗福莉以新身份亮相,并带来了小米最新发布的AI模型MiMo-V2-Flash。这一模型的推出,标志着小米在人工智能领域迈出了重要一步,也引发了外界对小米AI战略的广泛关注。
MiMo-V2-Flash是一款参数规模为309B、激活参数15B的模型。尽管罗福莉本人笑称其尺寸小到不愿称之为“大模型”,但这款模型在性能上却不容小觑。小米团队将其定位为Agent基座模型,重点优化了高性价比和快速响应能力。据介绍,该模型每秒可生成150个tokens,成本极低,同时在性能上保持了较高水准。
在公开评估榜单上,MiMo-V2-Flash的代码能力和Agent能力表现突出,已跻身全球开源模型前列。罗福莉透露,该模型在多数评估基准上已超越或与DeepSeek-V3、Kimi K2-Thinking、Qwen等知名模型相当,而参数规模仅为后者的三分之一到二分之一。这一成绩引发了行业热议,有人盛赞其代码能力领先,也有人质疑其是否为“刷分”之作。
无论外界评价如何,小米对AI的重视已显而易见。选择在“人车家全生态大会”上发布新模型,本身就凸显了AI在小米战略中的核心地位。小米面临两大任务:一是在智能终端领域,通过轻量化模型和端侧部署,升级“超级小爱”和澎湃OS,将AI深度融入智能设备;二是在智能驾驶领域,依托大模型提升智驾能力,拓展技术边界。
小米的AI路线并非盲目跟风。罗福莉指出,当前模型学习方向与生物智能进化存在背离,单纯依靠“大力出奇迹”已难以实现更高阶的智能突破。因此,小米选择了一条更符合自身需求的路径——打造参数小、性能优、成本低的模型。她解释称,Scaling Law的边际效益逐渐递减,预训练范式正向后训练转变,而稳定的后训练范式能够更好地激发强化学习潜力。
基于此,MiMo-V2-Flash的优化逻辑围绕三个关键点展开:强化代码能力和工具调用以提升智能体交互效率;通过极高推理效率解决信息传递瓶颈;通过稳定范式激发强化学习潜能。这些优化使得该模型在代码能力上尤为突出,甚至在SWE-Bench Multilingual测试中超越了GPT-5等闭源模型。
在成本和速度方面,MiMo-V2-Flash同样表现亮眼。以Claude Sonnet 4.5为对比,其推理价格仅为前者的2.5%,生成速度却快一倍。API定价方面,输入为0.7元/百万tokens,输出为2.1元/百万tokens,在国内模型中极具竞争力。这一优势得益于小米采用的混合注意力机制技术架构,即5:1的滑动窗口注意力与全局注意力混合结构,既提升了长文和推理能力,又适配现有基础设施。
然而,309B的参数规模对于端侧部署仍是一个挑战。罗福莉在演讲中提出了更具前瞻性的观点:AI进化的下一阶段需要能够与真实环境交互的物理模型,打造一个具备物理一致性和时空连贯性的虚拟宇宙。这一愿景暗示了小米未来的技术方向——一方面持续优化端侧模型,为智能终端赋能;另一方面攻克物理模型,提升智驾能力。
小米的AI战略已进入快车道。2025年,小米在MiMo系列上动作频频:4月开源MiMo-7B系列,5月发布MiMo-VL-7B突破多模态视觉理解,11月推出MiMo-Embodied具身智能大模型整合自动驾驶与机器人技术,12月则以MiMo-V2-Flash压轴登场。这一系列布局背后是巨额投入——小米集团总裁卢伟冰透露,2025年研发投入预计超300亿元,其中四分之一投向AI领域,未来五年计划投入超2000亿元。
组织架构上,小米也在为AI战略铺路。2024年起,小米搭建了AI Infra平台,并着手组建GPU万卡集群,团队成立时已拥有6500张GPU资源。人才方面,除了罗福莉负责基础大模型,小米还引入陈龙加盟智驾团队,形成“双核”配置。陈龙团队提出的跨具身基座模型MiMo-Embodied,试图解决自动驾驶与机器人间的知识迁移难题,为小米硬件生态提供统一AI驱动逻辑。
雷军曾强调,小米的AI战略是“轻量化+本地部署”。凭借全球超10亿台设备的连接优势,小米正试图通过AI重塑业务逻辑。MiMo-V2-Flash的发布不仅是技术展示,更是小米向资本市场和用户传递的新信号:这家硬件巨头正通过高效“大脑”和广泛“身体”的结合,在智能时代寻求彻底进化。而这一进程的关键,在于技术能否真正落地于每一台小米设备,转化为用户可感知的体验提升。















