开发者生态
morning
米哈游一夜烧掉200万元Token,大厂高管也开始质疑:Token烧不出价值,但养肥了谁?
2026-05-28
1 阅读
褚杏娟
终于有高管站出来,用自己的实际经验直接质疑 tokenmaxxing 成本问题了。 Uber 运营负责人 Andrew Macdonald 在近期的访谈中直接表示,公司内部越来越难证明 AI tokenmaxxing成本是合理的。 此前,Uber 首席技术官 Praveen Neppalli Naga 曾在 4 月份时透露,Uber 已经提前用完了 2026 年的 Claude Code 预算。这番话随后在网上引发热议。Macdonald 形容自己那一刻像是“脑袋炸开了”,公司内部也开启了一场关于 token 消耗的讨论,以及这种消耗所带来的取舍,比如是否会影响员工人数。 根据与 Uber 高级工程管理层的交流, Macdonald意识到:更高的 token 使用量,并没有转化为同等比例的、有用的消费者功能增长。 “这中间的联系还没有建立起来,对吧?”他说道,“我觉得也许从隐性层面看,确实有更多东西被交付出来了,但很难在这些数据和‘好,现在我们真的多产出了 25% 的有用消费者功能’之间画出一条清晰的线。” Macdonald表示,由于无法建立直接联系,AI 带来的取舍成本就更难被合理化。需要注意的是,本月早些时候,Uber CEO Dara Khosrowshahi 在财报电话会上表示,为了对冲 AI 投入,公司正在放缓招聘。 Macdonald 补充称,如果你只是“坐在那里想各种有趣用例的用户”,而且不用自己付钱,AI 看起来确实像是免费的。但最终,账单是由公司来买单。 要tokenmaxxing?先问自己钱够吗 对于大公司来说,不用“Tokenmaxxing”,日常一次尝试就很烧钱了。 5月20日,《崩坏》系列AI NPC & Gameplay技术团队负责人郑银河在2026阿里云峰会上无意透露了内部对agent尝试的成本:有员工为了实现项目,建了几十个Agent共同协作,结果一晚上烧了价值200万人民币的Token。 “我们接受在探索AI时有成本、有学费,这也帮助更完善我们的Agent平台。”话虽如此,但有网友指出,这200万人民币的价值似乎并没有显著体现出来。 而这种“豪气”并非每个公司都能负担得起。就像有网友打趣道:“一单648才半个多金,两百万不过是三个全65氪佬养服的钱。” 值得注意的是,5月15日,米哈游联合创始人刘伟曾在外部活动中表示,未来三年,最多投入1000亿元以深耕AI领域。他坦言,“就算最终不成功,没做出来,也认了,就当放一场大烟花。” “我们作为一个‘all in ai ’口号的公司,在某一天用了十万块钱的token后,封掉了所有人的API。”有网友对此评论道。 已有公司开始调整 当大型科技公司还在大力推进所谓的 “tokenmaxxing”时,一些公司已经开始往相反方向调整。 例如,多邻国此前曾决定把 AI 使用情况纳入绩效评估,但在员工提出疑问“他们是否只是为了使用 AI 而不得不用 AI”后,公司撤回了这一做法。 多邻国 CEO Luis von Ahn 在 4 月的一期播客访谈中 "曾说道: “多邻国确实曾把 AI 使用情况纳入绩效考核,但后来我们取消了。我给公司发过内部备忘录,说明绩效考核会包含 AI 使用情况,结果发现员工们会疑惑,“是不是为了用 AI 而用 AI?”。最后我们收回了这个要求,因为绩效考核最重要的是把本职工作做到最好,AI 很多时候能帮上忙,但没必要强制使用。我们不想让大家为了迎合形式而忽略实际工作成果,有些场景 AI 本身就不适用。” 还有像Shopify这样的公司开始想办法阻止失控的token消耗。 Shopify 是较早尝试 Token 排行榜的公司之一。其工程负责人 Farhan Thawar 曾表示,公司会表扬使用 Token 最多的人,因为他们可能正在用 AI 做出有价值的工作。例如,一个月在 Cursor 上花费 1000 美元的开发者,可能背后已经建立了一支 Agent 员工队伍。 但 Shopify 后来将“Token 排行榜”改名为“使用情况仪表盘”。原因是,公司不希望鼓励员工为了冲榜而竞争。Token 花费仍会展示在内部个人资料页和使用仪表盘中,但重点从“排名”转向“理解使用情况”。 Shopify 还设置了“熔断机制”。如果某个员工的个人花费在一天内突然激增,公司可以立刻切断访问权限。如果这次激增是有意为之,或确实是 Agent 失控,员工可以申请恢复。 Farhan 表示,这套机制不仅帮助公司发现了失控 Agent,也暴露出了基础设施中的 bug。更重要的是,Shopify 会关注高 Token 使用者到底在做什么。高支出员工会被询问具体使用场景,如果有人只是单纯刷 Token,很可能会在这一过程中暴露出来。 Farhan 还提出一个更有价值的角度:与其只看“谁花的钱最多”,不如看“谁生成的 Token 最贵”。一些高成本 Token 背后,往往对应更深入、更复杂的开发工作,这比单纯的总量排名更有参考价值。 Tokenmaxxing潮中的赢家们 Tokenmaxxing 的本质是把企业内部 AI 使用从“按需调用”变成“鼓励消耗”。只要企业把 token 使用量当成先进性指标,模型厂商就获得了一个近乎完美的增长飞轮。 Tokenmaxxing 最直接的受益方,是 OpenAI、Anthropic、Google、xAI 等基础模型厂商。 因为 token 本身就是模型调用的计费单位。企业一旦把 token 使用量变成内部排行榜或绩效信号,员工就会从“按需调用 AI”转向“主动制造 AI 使用量”。这会直接放大模型 API 调用、企业订阅和推理收入。 Meta 的案例最能说明这一点。Meta 员工在 30 天内消耗了 60.2 万亿个 AI token,如果按照 Anthropic API 价格计算,这笔成本可能高达 9 亿美元;即便 Meta 能拿到折扣,成本也可能超过 1 亿美元。 这意味着,Tokenmaxxing 一旦在大型企业内部规模化,就不再是普通工具开销,而是上亿美元级别的推理账单。 Anthropic 的收入增长也能反映这种趋势。Reuters 最新报道称,Anthropic 预计 2026 年第二季度销售额将超过 109 亿美元,高于第一季度的 48 亿美元,并有望实现 5.59 亿美元经营利润。此前报道,Anthropic 的 Claude Code 在推出当年就接近 10 亿美元年化收入。 也就是说,对模型厂商而言,Tokenmaxxing 本质上是在把企业内部焦虑转化为 API 收入。当然,这不意味着模型公司没有算力压力,但Tokenmaxxing 至少给了他们很可观的收入。 第二类赢家,是 Cursor、Claude Code、Windsurf、Replit、Lovable 等 AI 编程工具和 Agent 平台。比如,Cursor 背后的 Anysphere 在 2025 年 11 月完成新一轮融资,估值接近 300 亿美元;公司称其年化收入已经超过 10 亿美元,销售驱动收入自 2025 年初以来增长了 100 倍。 但这不代表AI工具类公司就能盈利。据外媒报道,Cursor、Wi