小米掀桌子!大模型 API 最高降 99%,真降价还是营销噱头?
编者按:
2026年5月下旬,国产大模型行业突然掀起一轮猛烈的降价潮。5月22日,DeepSeek率先下调API价格;仅仅五天后,小米在5月27日正式宣布,MiMo‑V2.5系列大模型API开启永久降价。最高99%的降幅、取消长文本阶梯溢价、套餐Token用量直接提升5到8倍,一连串动作迅速引爆行业讨论。有人说这是AI普惠的真正开始,也有人质疑不过是吸引眼球的数字游戏。小米到底是真心让利,还是营销造势。

数据说话
99%降幅有明确场景,定价规则被彻底重构
“最高直降99%”的消息一出,不少人的第一反应是:会不会又是文字游戏?
结合小米官方发布的完整调价信息可以确认,这次降价并非虚标,但有一个关键前提必须说清:99%的最大降幅,只针对缓存命中的输入Token。
本次降价仅覆盖MiMo‑V2.5、MiMo‑V2.5‑Pro两个主力版本,高阶模型如MiMo‑V2‑Pro、V2‑Omni以及语音TTS并不在范围内,而且所有新价都是永久定价,不是短期促销。
先看旗舰款MiMo‑V2.5‑Pro:缓存命中输入Token降至0.025元/百万,对比原来长上下文2.8元的价格,降幅刚好99%;即便是对标短窗口版本,降幅也达到98%。除此之外,未命中缓存的输入价格降至3元,较原价下降79%;输出Token降至6元,对比此前最高42元的价格,降幅达86%。

标准版MiMo‑V2.5更亲民,缓存命中输入仅0.02元/百万Tokens,未命中1元、输出2元,几乎把入门门槛压到了地板。
比降价更颠覆行业的,是小米直接取消了上下文窗口长度差价。
在此之前,行业普遍按窗口大小收费:256k以内一个价,超过就涨价,长文档、知识库、合同分析等场景成本明显更高。小米这次直接统一价格,无论短对话还是百万字长文本,都按同一标准计费,相当于把长文本应用的成本壁垒直接拆掉。
与此同时,小米还升级了付费套餐:价格不变,但Credit兑换Token的比例提升5至8倍。同样39元,过去只能买一份额度,现在能买到五六份甚至更多,对高频使用的AI客服、内容生成、智能助手项目来说,成本几乎被再次腰斩。
综合来看,99%的极限降幅确实存在,而且集中在缓存命中这种高频场景——企业客服、日常助手、固定知识库查询的命中率普遍超过90%,绝大多数用户都能真正享受到低价。再加上统一窗口价、套餐加量,这已经不是单点噱头,而是一整套彻底下沉的定价体系。
真正让AI走向普及的,从来不是一时优惠,而是把价格压进日常可用的区间。

底气何在
技术把成本打下来,生态把格局打开
在整个行业对价格战慎之又慎的当下,小米为什么敢一次性降得这么狠?
答案不是“烧钱”,而是技术能撑住,战略必须做。
小米这次降价的核心底气,来自推理与缓存技术的深度优化。MiMo‑V2.5系列使用SWA分层KV缓存和稀疏注意力架构,简单说就是:能复用的绝不重算,能轻量化的绝不浪费算力。
KV缓存的作用,是把历史对话、重复查询存下来,下次直接调用。小米的分层缓存技术把缓存成本直接降低80%,这也是缓存场景能做到近乎免费的关键。在注意力机制上,模型采用Full Attention与SWA 1:7的混合结构,70层里只有10层使用高算力模式,其余全部轻量化运行,在保证效果的前提下把算力用到极致。
也正因如此,小米官方明确表示,新价格可以实现基本收支平衡,不需要靠手机、汽车等业务持续输血补贴。
敢把价格打到极致,靠的不是勇气,而是把成本做到极致的技术实力。
从行业竞争看,小米的动作也并非突发奇想。
5月22日DeepSeek降价,5月27日小米紧跟,两者最终定价高度接近。这不是巧合,而是行业逻辑正在转变:大模型能力差距逐步缩小,价格、服务、开发者生态,变成了新一轮竞赛的核心。对后来者而言,用合理低价吸引开发者入场,是最直接、最有效的破局方式。
再回到小米自身。
2026年一季度,小米营收991亿元,同比下滑10.9%;经调整净利润61亿元,同比下降43.1%。手机业务进入存量期,汽车业务仍在投入,增长压力显而易见。在这样的背景下,AI成为小米最确定的新增长曲线。雷军也曾公开表示,未来三年将投入600亿元布局AI。
这次API大降价,本质就是以价换生态:
用更低的成本吸引开发者、中小企业、创业团队基于MiMo做应用;应用越多,小米手机、车机、IoT设备的智能体验就越强;终端再反过来拉动模型使用量,最终形成“大模型—应用—终端”的闭环。
低价只能打开一扇门,真正留住开发者的,是完整的生态与持续的价值。
当然,这场价格战也会加速行业洗牌。有技术、有算力、有现金流的大厂能继续玩,缺乏自研能力、只靠大模型单打独斗的中小厂商会越来越难。同时也要客观看到,MiMo‑V2.5在长链推理、代码能力、幻觉控制等方面,和行业第一梯队仍有差距。低价能带来第一次尝试,但能不能留住用户,最终还是要看模型本身的实力。

结 语
综合官方数据、技术支撑与行业格局来看,小米这次API大降价,并不是一场营销噱头,而是技术降本与生态战略共同推动的理性选择。99%的降幅有明确场景支撑,取消长文本溢价、套餐扩容等规则,也实实在在降低了整个AI开发的门槛。
这场调价,正式把国产大模型推进普惠时代。价格战会倒逼全行业提升效率、压缩冗余成本,但行业的终极比拼,从来不是谁更便宜。
小米用“掀桌子”的方式搅动了市场,但真正的考验才刚刚开始。
AI行业的胜负,从来不在谁更便宜,而在谁更能创造长期价值。