开发者生态
morning
科技爱好者周刊(第 398 期):Token 费用难以负担
2026-05-29
1 阅读
阮一峰
科技爱好者周刊(第 398 期):Token 费用难以负担 作者: 阮一峰 日期: 2026年5月29日 这里记录每周值得分享的科技内容,周五发布。 本杂志 开源 ,欢迎 投稿 。另有 《谁在招人》 服务,发布程序员招聘信息。合作请 邮件联系 ( [email protected] )。 封面图 去年开放的浙江省安吉县的安吉文化艺术中心。当地盛产竹子,屋顶都采用竹叶造型。( daemin_kg@ig ) Token 费用难以负担 上周,OpenClaw(龙虾)的创始人彼得·斯坦伯格(Peter Steinberger)贴出了自己的 Token 使用量 。 他不是故意炫耀,自己用了多少 Token,而是为了介绍工具软件 CodexBar 。这个菜单栏小工具可以统计你的 Token 使用量,计算出对应的费用。 大家猜猜看,他用了多少 Token? 根据截图,他一个月发出了760万个请求,消耗的 Token 数量为6030亿。根据预设的费率,这些 Token 价值130万美元! 也就是说, 他的 AI 编程平均每天要花费4万多美元 。 当然,这个数字不是真实支出。因为他是 OpenAI 公司的员工,可以无限量免费使用公司的 Token。所以,这些钱并不是真实的支出。 但是,他的 Token 使用量是真的。绝大部分公司需要外购 Token,大家可以用他的例子计算一下,如果一个程序员每月用掉几千亿、甚至上万亿的 Token,公司要出多少钱? 他一个人一个月130万美元,相当于近900万人民币, 一年下来超过1亿人民币! 这就是放开使用顶级模型,公司要支付的费用。 如果改用便宜的模型,国内最便宜的开源模型,价格大约是国外旗舰模型的1/30到1/50,那么一年就是200万~300万人民币。 结论就是, 如果放开不限量使用,一个程序员一年最少会花掉两三百万人民币的 Token 费用 。要是使用美国的旗舰模型,费用会快速上涨到几千万甚至上亿人民币。 公司想要降低成本,有两个方法:一是购买包月套餐,但是大项目不够用;二是自己架设开源模型,省掉外购的费用,但是硬件费用不便宜,而且最强的模型目前是不开源的。 权衡下来,我猜想, 公司几乎肯定会设置限制,不允许程序员无限量使用外部模型 。那样的话,巨额的 Token 费用难以承受。程序员的工资已经不低了,再加上每人每年至少几百万人民币的 Token 费用,公司的开发成本会爆炸的。 大家可以说说,有没有公司对程序员提供外部模型无限量 API 调用?我是没有听说过。 事实上,因为 Token 费用太高,公司收紧 AI 编程的例子,我倒是知道几个。 比如,网约车巨头 Uber 今年头四个月就花完了全年34亿美元的 AI 预算,不得不限制使用 AI 了。 再比如, 微软 也因为费用超标,放弃了 Claude Code,改用自家托管的 OpenAI 模型。 如果 Uber 和微软这样的巨头,都承受不了巨额的 Token 费用,那大概就没有公司能够承受了。 总之,AI 编程虽然听起来很美好,但是看到账单的那一刻,公司就会清醒: AI 编程比真人程序员昂贵太多了 。 所以,AI 会替代程序员吗?对于有大型软件项目的公司,我认为不会大规模替代,因为成本放在那里。至少现阶段如此,如果未来 Token 费用大幅下降,那就难说了。 漏洞赏金计划的终结 Turso 是一个开源的云数据库,代码放在 GitHub。 它有一个赏金计划,给予发现漏洞的人1000美元奖金。本来运作得挺好,自从大模型可以用来发现漏洞以后,事情就不对了。 它的仓库的 PR 页面(外部代码提交)已经变成下面这样。 提交漏洞的人泛滥成灾,都是冲着奖金而来。他们所谓的漏洞,往往是故意注入垃圾字节,或者是配置错误,自然就是无法运行。 开发团队精疲力尽,不胜其扰。有时候,关掉这些 PR,提交者还会跟你争论,用 AI 生成的 长篇大论 告诉开发团队"我没错,你们搞错了",令人啼笑皆非。 最终,开发团队只能宣布, 终止赏金计划 ,提交漏洞和 PR 都不会有奖金。 炮制垃圾内容的人可能只需要一分钟就能提交,但我们却要花费数小时来阅读、理解和回应。而且,这类内容的生成速度几乎是无限的。 虽然可以设置自动化脚本来过滤 PR,但由于涉及到奖金,提交 AI 代码的动机实在太大,总是有人无休止地争论、重新打开同一个 PR 等等。 这件事告诉我们,传统的漏洞赏金计划在 AI 时代大概率行不通。以后,发现漏洞很可能没有奖金。不知道这会不会导致线上攻击行为的增加。 科技动态 1、 体重与气温 一支耶鲁大学的考察队,发现阿根廷的猫头鹰猴比25年前更重。2023年的猴子平均体重比1999年重了50克,相当于增加了4%。 科学家认为,这与气温上升有关。1999年阿根廷的日平均气温为22.2摄氏度,2023年上升到了23.8摄氏度。 气温上升使得猴子减少用于体温调节的能量消耗,从而有额外的卡路里来增重。 该理论看上去也适用于人类,也就是说,全球变暖可能让胖子变多。 2、 人工蛋壳 美国生物科技公司 Colossal 制造了"人工蛋壳",已经孵化了26只小鸡。 它的外壳是一个坚固的六边形杯状结构,起到支撑作用;内壁是一层半透膜材料,能让氧气轻松通过,又能保持水分。 科研人员将小鸡胚胎放入"人工蛋壳",在孵化箱中成功孵化了小鸡。 上图中,蛋壳上方是透明的,可以观察内部情况。 Colossal 公司制造这个装置的目的,是为了复活已经灭绝的渡渡鸟。否则,就算做出了渡渡鸟的克隆胚胎,还是要放在其他动物(比如鸵鸟)体内进行繁殖。 3、 艺术抗议 保加利亚首都索非亚,马路上有一个小坑,市政府长期不修补。 两个艺术家感到不满,就在这个小坑上涂鸦,画了一个生气的鬼脸。 鲜艳的图案让司机和行人更容易注意到,减少了事故。同时,也引起了大众的兴趣,新闻媒体纷纷报道,小坑很快就修补了。 这件事告诉我们,不满还是要表达出来,可以推动解决,并且采用艺术形式表达,效果会比较好,容易让人接受。 文章 1、 内存涨价的原因 (英文) 内存厂商生产三种内存:DDR(桌面电脑用的内存)、LPDDR(手机用的低功率内存)、HBM(AI 机房用的高带宽内存)。 由于 AI 公司对 HBM 的需求激增,开出高价,内存厂商的生产能力转向 HBM,减少了 DDR 和 LPDDR 的产量,导致消费电子设备的内存短缺,价格上涨。 2、 我开始研究 Reticulum (英文) Reticulum 是一个自己组网的项目,可以在各种物理网络(WiFi、有线网、无线电、LoRa 等)之上架设虚拟网络,本文是一个简介。 3、 预热你的 MacBook (英文) 一篇很冷的文章,Mac 系统有一个 stress 命令,用来让 CPU 运行负载。本文提出可以用这个命令,让冬天冰冷的 MacBook 金属外壳变热。 4、 为什么我反对布尔逻辑 (英文) 一篇偏哲学思辨的文章。布尔逻辑只有两个值(真和伪),作者认为,这会导致非黑即白的二元思维。真实世界是非布尔逻辑,充满了不确定性和不唯一性。 5、 为什么中心极限定理无处不在? (英文) 一篇科普文章,介绍中心极限定理的历史和含义。这个定理发现了样本平均值的分布规律,所以极其