智能AI
morning
小米大模型永久降价99%,正面对标DeepSeek?
2026-05-27
1 阅读
影子备忘录
文 | 影子备忘录 此前,DeepSeek宣布API降价,紧接着,小米也宣布其大模型永久降价,最高可达99%。 时间线上看,5月22日,DeepSeek宣布V4-Pro模型API价格永久降价75%,缓存命中输入低至每百万Tokens 0.025元人民币。 仅过了5天,5月27日,小米就祭出杀招:MiMo-V2.5系列API永久降价,最高降幅99%,Pro版缓存命中输入降到与DeepSeek相同的0.025元/百万Tokens,标准版甚至更低——0.02元/百万Tokens。 同一价位、甚至更低,前后脚宣布。这不是跟风,是实实在在的“对标”。 如果你是一名开发者,5月27日这天,你在小米和DeepSeek之间已经不需要再做选择题,因为两边一样便宜。 但如果拉长时间线,我们看到的不只是一场简单的价格战——这是一场关于技术路线、生态战略与AI普惠模式的中国式博弈。 小米与DeepSeek,一个是硬件巨头转型AI的追赶者,一个是纯血AI技术派的破局者。看似都打着“降价”这张牌,但牌桌下面,拼的却是完全不同的底牌。 为什么降价能“永久”? 在拆解双方的技术底牌之前,先问一个更尖锐的问题:凭什么能永久降价? 大模型API的定价,本质上由三部分构成:算力成本+运营成本+合理的利润空间。算力成本是最大的变量,它取决于芯片采购、集群效率和模型本身的推理开销。 DeepSeek敢降价的底气,来自技术底层的颠覆性创新。其V3模型以约600万美元的训练成本实现了对标GPT-4级别的性能——这一数字仅为同类模型训练成本的数十分之一。 DeepSeek自研的稀疏注意力机制使V4系列在处理百万级Token长上下文时,算力消耗仅为上代产品的27%,KV Cache占用降至10%。 它不是用资本换市场,而是用技术换成本。 小米呢?5月26日,雷军宣布未来三年在AI领域投入600亿元。一季度研发投入90亿元,同比增长33.4%,全年研发预计超400亿元。600亿真金白银砸下去,做的是两件事: 一是追赶技术差距,二是摊薄推理成本,靠规模效应和端侧优势把单位成本打下来。 两者的底层逻辑截然不同。 小米真的能打了吗? 在谈论价格之前,先说能力——大模型的核心竞争力,终究是技术本身。 DeepSeek的壁垒是MoE(混合专家)架构的极致工程化。 DeepSeek-V3总参数671B,单Token仅激活约37B参数,激活占比仅约5.5%。加上MLA(多头潜在注意力)机制,KV缓存压缩至传统注意力的几分之一,长文本推理内存大幅降低。 这是从根源上砍算力的能力。 小米追赶的速度超乎很多人预期。MiMo-V2.5系列于2026年4月发布,包含两款核心模型。 MiMo-V2.5-Pro采用MoE架构,总参数1.02T(激活42B),预训练使用27万亿Token,原生序列32K后扩展至1M。 MiMo-V2.5为全模态模型,310B总参数(激活15B),支持文本、图像、视频、音频全模态理解。 在Artificial Analysis综合智能指数和Agent指数上,MiMo-V2.5-Pro均为全球开源模型并列第一。 SWE-bench Pro得分57.2%,超越DeepSeek V4 Pro的55.4%和Gemini 3.1 Pro的54.2%。 Agent任务上,ClawEval得分63.8%,全球开源第一。 在ClawEval测试中,小米表示“每条轨迹仅消耗约7万Token,与GPT-5.4等同等能力水平下相比,Token消耗减少约40%-60%”。 就技术而言,MiMo-V2.5-Pro的推理成本本来就有结构性优势——Token效率做得好,同样的任务消耗更少资源。 降价是能力提升的结果,而非单纯的定价策略调整。 两种技术路线在底层趋同(都走MoE稀疏激活),但能力侧重点不同。 DeepSeek主打通用知识深度与推理能力,MiMo-V2.5-Pro在长上下文Agent任务和多模态领域相对占优。 小米还有一张DeepSeek不具备的王牌:软硬协同的端侧落地。 在小米“人车家全生态”战略下,MiMo大模型正在全面渗透手机、汽车、智能家居。 一季度小米在AI领域研发投入90亿元,小米正在用AI重塑旗下全部终端产品。 AGI研究者罗福莉去年底加盟小米担任MiMo大模型负责人后,团队快速迭代多代模型,完成了从语言到多模态到语音的全矩阵布局。 如果你认为小米只是想卖API赚钱,那就看错了一家硬件巨头的大模型战略。 DeepSeek VS小米,两种降价逻辑的较量 2025年11月,一则人事变动震动AI圈:曾任职DeepSeek的95后AI技术人才罗福莉正式加盟小米,出任MiMo大模型负责人。雷军被传以千万年薪力邀其加入。 在罗福莉的统筹下,小米MiMo大模型快速完成多代迭代,仅用几个月就从MiMo-V2-Pro迭代到V2.5系列,补齐了高性能推理、轻量化通用交互、语音合成等全场景能力。 从DeepSeek到小米,罗福莉带来的不仅是个人能力,更是一种工程师驱动的文化——强调效率、追求低成本高回报的技术路线。 这或许解释了为什么小米的降价逻辑在某种程度上与DeepSeek高度相似:不是补贴战,而是效率战。 此外,据北京商报记者统计,2026年以来小米以密集节奏发布和更新多款模型,从VLA大模型到移动端Agent产品Xiaomi miclaw,从MiMo-V2系列到V2.5系列的全模态模型矩阵,再到语音合成与识别、自动驾驶模型等,覆盖面之广、迭代速度之快,在业界罕见。 这种速度和节奏,在很多企业看来可能是“战略性投入”,但对小米来说,更像是一种“补课”——好在,它补得很快。 回到价格本身,小米此番降价细节值得拆解。 MiMo-V2.5-Pro:输入缓存命中从2.80元降至0.025元/百万Tokens(降99%),输出从42元降至6元(降86%);MiMo-V2.5标准版:输入缓存命中从1.12元降至0.02元(降98%),输出从28元降至2元(降93%)。 同时,小米取消上下文窗口长度的区分定价,优化Token Plan计费,同等价格下Token用量提升5至8倍。 这场降价大战其实分两个阶段:第一阶段,DeepSeek于4月25日在两天内两次降价,将V4-Pro缓存命中价格降至0.025元,打破了行业价格天花板。 在推理端调用量激增、算力和存储成本高涨的背景下,多数大模型公司选择涨价,部分涨幅甚至高达463%。 DeepSeek逆市降价以技术驱动的成本下降打破行业“AI理应越来越贵”的预期。 第二阶段,小米卡位跟进,价格直接对标DeepSeek,甚至更低。这既是价格战,更是信号战——表明小米在大模型API市场已有规模化的底气和争夺份额的决心。 同样挂着“降价”的招牌,两者逻辑天差地别: DeepSeek是“技术溢出”:架构创新和工程优化降低了单位推理成本,将部分技术红利直接回馈给市场。它不需要靠降价维持用户,而是降价本身就是技术优势的证明。 小米是“生态卡位”:用硬件利润反哺AI研发,通过降价抢夺开发者用户。 一旦开发者习惯使用MiMo,那开发者在小米IoT生态中开发应用、用AI赋能汽车和手机,都将更加顺畅。API降价不仅是价格战,更是小米构建AI生态的前