小米大模型永久降价99%，正面对标DeepSeek？

文 | 影子备忘录此前，DeepSeek宣布API降价，紧接着，小米也宣布其大模型永久降价，最高可达99%。时间线上看，5月22日，DeepSeek宣布V4-Pro模型API价格永久降价75%，缓存命中输入低至每百万Tokens 0.025元人民币。仅过了5天，5月27日，小米就祭出杀招：MiMo-V2.5系列API永久降价，最高降幅99%，Pro版缓存命中输入降到与DeepSeek相同的0.025元/百万Tokens，标准版甚至更低——0.02元/百万Tokens。同一价位、甚至更低，前后脚宣布。这不是跟风，是实实在在的“对标”。如果你是一名开发者，5月27日这天，你在小米和DeepSeek之间已经不需要再做选择题，因为两边一样便宜。但如果拉长时间线，我们看到的不只是一场简单的价格战——这是一场关于技术路线、生态战略与AI普惠模式的中国式博弈。小米与DeepSeek，一个是硬件巨头转型AI的追赶者，一个是纯血AI技术派的破局者。看似都打着“降价”这张牌，但牌桌下面，拼的却是完全不同的底牌。为什么降价能“永久”？在拆解双方的技术底牌之前，先问一个更尖锐的问题：凭什么能永久降价？大模型API的定价，本质上由三部分构成：算力成本+运营成本+合理的利润空间。算力成本是最大的变量，它取决于芯片采购、集群效率和模型本身的推理开销。 DeepSeek敢降价的底气，来自技术底层的颠覆性创新。其V3模型以约600万美元的训练成本实现了对标GPT-4级别的性能——这一数字仅为同类模型训练成本的数十分之一。 DeepSeek自研的稀疏注意力机制使V4系列在处理百万级Token长上下文时，算力消耗仅为上代产品的27%，KV Cache占用降至10%。它不是用资本换市场，而是用技术换成本。小米呢？5月26日，雷军宣布未来三年在AI领域投入600亿元。一季度研发投入90亿元，同比增长33.4%，全年研发预计超400亿元。600亿真金白银砸下去，做的是两件事：一是追赶技术差距，二是摊薄推理成本，靠规模效应和端侧优势把单位成本打下来。两者的底层逻辑截然不同。小米真的能打了吗？在谈论价格之前，先说能力——大模型的核心竞争力，终究是技术本身。 DeepSeek的壁垒是MoE（混合专家）架构的极致工程化。 DeepSeek-V3总参数671B，单Token仅激活约37B参数，激活占比仅约5.5%。加上MLA（多头潜在注意力）机制，KV缓存压缩至传统注意力的几分之一，长文本推理内存大幅降低。这是从根源上砍算力的能力。小米追赶的速度超乎很多人预期。MiMo-V2.5系列于2026年4月发布，包含两款核心模型。 MiMo-V2.5-Pro采用MoE架构，总参数1.02T（激活42B），预训练使用27万亿Token，原生序列32K后扩展至1M。 MiMo-V2.5为全模态模型，310B总参数（激活15B），支持文本、图像、视频、音频全模态理解。在Artificial Analysis综合智能指数和Agent指数上，MiMo-V2.5-Pro均为全球开源模型并列第一。 SWE-bench Pro得分57.2%，超越DeepSeek V4 Pro的55.4%和Gemini 3.1 Pro的54.2%。 Agent任务上，ClawEval得分63.8%，全球开源第一。在ClawEval测试中，小米表示“每条轨迹仅消耗约7万Token，与GPT-5.4等同等能力水平下相比，Token消耗减少约40%-60%”。就技术而言，MiMo-V2.5-Pro的推理成本本来就有结构性优势——Token效率做得好，同样的任务消耗更少资源。降价是能力提升的结果，而非单纯的定价策略调整。两种技术路线在底层趋同（都走MoE稀疏激活），但能力侧重点不同。 DeepSeek主打通用知识深度与推理能力，MiMo-V2.5-Pro在长上下文Agent任务和多模态领域相对占优。小米还有一张DeepSeek不具备的王牌：软硬协同的端侧落地。在小米“人车家全生态”战略下，MiMo大模型正在全面渗透手机、汽车、智能家居。一季度小米在AI领域研发投入90亿元，小米正在用AI重塑旗下全部终端产品。 AGI研究者罗福莉去年底加盟小米担任MiMo大模型负责人后，团队快速迭代多代模型，完成了从语言到多模态到语音的全矩阵布局。如果你认为小米只是想卖API赚钱，那就看错了一家硬件巨头的大模型战略。 DeepSeek VS小米，两种降价逻辑的较量 2025年11月，一则人事变动震动AI圈：曾任职DeepSeek的95后AI技术人才罗福莉正式加盟小米，出任MiMo大模型负责人。雷军被传以千万年薪力邀其加入。在罗福莉的统筹下，小米MiMo大模型快速完成多代迭代，仅用几个月就从MiMo-V2-Pro迭代到V2.5系列，补齐了高性能推理、轻量化通用交互、语音合成等全场景能力。从DeepSeek到小米，罗福莉带来的不仅是个人能力，更是一种工程师驱动的文化——强调效率、追求低成本高回报的技术路线。这或许解释了为什么小米的降价逻辑在某种程度上与DeepSeek高度相似：不是补贴战，而是效率战。此外，据北京商报记者统计，2026年以来小米以密集节奏发布和更新多款模型，从VLA大模型到移动端Agent产品Xiaomi miclaw，从MiMo-V2系列到V2.5系列的全模态模型矩阵，再到语音合成与识别、自动驾驶模型等，覆盖面之广、迭代速度之快，在业界罕见。这种速度和节奏，在很多企业看来可能是“战略性投入”，但对小米来说，更像是一种“补课”——好在，它补得很快。回到价格本身，小米此番降价细节值得拆解。 MiMo-V2.5-Pro：输入缓存命中从2.80元降至0.025元/百万Tokens（降99%），输出从42元降至6元（降86%）；MiMo-V2.5标准版：输入缓存命中从1.12元降至0.02元（降98%），输出从28元降至2元（降93%）。同时，小米取消上下文窗口长度的区分定价，优化Token Plan计费，同等价格下Token用量提升5至8倍。这场降价大战其实分两个阶段：第一阶段，DeepSeek于4月25日在两天内两次降价，将V4-Pro缓存命中价格降至0.025元，打破了行业价格天花板。在推理端调用量激增、算力和存储成本高涨的背景下，多数大模型公司选择涨价，部分涨幅甚至高达463%。 DeepSeek逆市降价以技术驱动的成本下降打破行业“AI理应越来越贵”的预期。第二阶段，小米卡位跟进，价格直接对标DeepSeek，甚至更低。这既是价格战，更是信号战——表明小米在大模型API市场已有规模化的底气和争夺份额的决心。同样挂着“降价”的招牌，两者逻辑天差地别： DeepSeek是“技术溢出”：架构创新和工程优化降低了单位推理成本，将部分技术红利直接回馈给市场。它不需要靠降价维持用户，而是降价本身就是技术优势的证明。小米是“生态卡位”：用硬件利润反哺AI研发，通过降价抢夺开发者用户。一旦开发者习惯使用MiMo，那开发者在小米IoT生态中开发应用、用AI赋能汽车和手机，都将更加顺畅。API降价不仅是价格战，更是小米构建AI生态的前