开发者生态
morning
神秘的 Hy3 LLM 大幅领先 OpenRouter 模型排名
2026-05-29
1 阅读
freediver
OpenRouter 是一项通过单一 API 提供对大多数 LLM 的访问的服务,鉴于新 LLM 版本的快速发布,该服务最近变得非常有用。由于该公司充当用户和 LLM API 之间的中介角色,OpenRouter 拥有有关用户如何与 LLM 交互的可靠且具有代表性的数据,并将这些数据发布在 AI 模型排名页面上:与实验室本身的偏差值得欢迎,实验室通常出于竞争原因对这些数据保密。最近,我查看了 OpenRouter 排名,发现了一些奇怪的情况。检索日期:2026 年 5 月 25 日。两种新模型现在在代币使用方面击败了 LLM 宠儿 Claude,并且领先 50% 以上?我听说过 DeepSeek Flash V4:它是 DeepSeek 的开源版本,不仅速度快/便宜,而且以非常低的成本执行更接近领先的 LLM 模型,因此它非常受欢迎也就不足为奇了。但 Hy3 预览版到底是什么?我从未听说过 Hy3 或任何人谈论过它。谷歌搜索返回了中国巨头腾讯关于 Hy3 开源版本的公告:Hugging Face 上的模型页面本身很少,并且包括奇怪的诚实基准测试结果,与其他中国开源模型相比,这些结果对该模型不利。来自腾讯 Hugging Face 存储库的 Hy3 面向编码的基准测试结果。 Hacker News 对 Hy3 的搜索只返回了一个与 Hy3 无关的提交内容,而 Reddit 的讨论更多是关于开放权重版本的。 Reddit 的一个帖子也注意到了 Hy3 的崛起,但从 5 月 6 日起,OpenRouter 免费提供 Hy3;该免费端点不再可用,因此上面每周排名中 Hy3 的使用量来自付费用户。 Hy3 预览版显然在代理编码之外的领域也很受欢迎。检索日期:2026 年 5 月 25 日。我错过了什么吗?经过一些非科学测试,模型质量确实与其他中国模型相当,但与 Claude Opus 4.7 和 GPT 5.5 等模型并不接近。这并不是一块被忽视的魔法,所以一定还有其他东西在起作用。幸运的是,OpenRouter 有数据来缩小可能的解释范围,但检查数据后我变得更加困惑。 Hy3 预览版可通过 OpenRouter API 获取,规定价格为 0.066 美元/100 万代币输入,这确实比当前排名第一的型号 DeepSeek V4 Flash 便宜,规定价格为 0.10 美元/100 万代币输入。鉴于法学硕士和编码代理的成本急剧上升,更便宜的模型会盛行是有道理的,但前提是它提供类似的质量,但事实似乎并非如此。以下是模型页面上 OpenRouter 上 Hy3 预览模型使用情况随时间变化的图表: Hy3 预览版在 5 月 8 日之前没有使用数据,这意味着该模型从免费 SKU 切换到付费 SKU 的时间。从那时起,随着时间的推移,使用量也保持稳定,本文中显示的初始排名是在发布几周后,这表明使用量至少是有机的(或者造假成本很高),而不是一次性的异常值。值得注意的是,如果您对此处提供的数字进行数学计算,LLM API 调用的输入令牌到输出令牌细分现在总计为 98% 输入,2% 输出。对于 OpenRouter AI 模型排名,历史上曾因特定应用程序将其默认值切换为特定的 LLM 而出现峰值,例如 Kilo Code 在 2025 年 9 月免费提供 Grok Code Fast 1,这使得它的受欢迎程度飙升。此处的情况似乎并非如此,因为应用程序仅构成 Hy3 预览版活动的一小部分。排名前 5 的应用程序占 Hy3 预览版所有活动的 <1%。 OpenRouter 的价值主张是能够自动将给定的 API 请求路由到不同的提供商:对于 DeepSeek V4 Flash 等开放权重模型,OpenRouter 列出了 13 个提供商,但 Hy3 预览版尽管具有开放权重 1,但只有一个提供商:新加坡的 SiliconFlow。他们在 OpenRouter 上的使用页面显示,SiliconFlow 的使用相对较少……直到 Hy3。绿色区域对应于免费的 Hy3 使用,而蓝色区域对应于付费的 Hy3 使用:OpenRouter 不会在鼠标悬停时区分它们,我怀疑这是一个错误。巧合的是,数据可视化显示,当 Hy3 预览版从免费转向付费时,使用率并没有大幅下降,这本身就很有趣:如果用户没有从免费模型中获得价值,那么一旦成本达到他们的钱包,他们很可能会停止使用它。我缺少什么?我是否想得太多了,答案真的是因为“它是最便宜的”,并且它在免费期间获得了足够的亏损领导者的吸引力? …但 Hy3 预览版实际上是 OpenRouter 上由大公司支持的最便宜的 LLM 吗?当我仔细检查一些假设时,我发现 OpenRouter 的数据显示 Hy3 预览版并不是最便宜的、性能良好的 LLM:它实际上是 DeepSeek V4 Flash,但有一些有趣的警告。法学硕士 经济学