今年永远不会是 Linux 桌面之年

2026-05-29 1 阅读 cylo
每年都会有人说今年是 Linux 桌面年。今年绝不是 Linux 桌面之年。造成这种情况的原因有很多。司机。游戏。阿多比。微软办公软件。电池寿命。当你合上笔记本电脑的盖子,稍后再打开它时,你会发现它已经进入了良夜。这些解释从小处看是正确的,从大处看却不尽人意。他们解释了为什么一个人上周四没有切换到 Linux。他们没有解释为什么桌面作为一个机构将继续属于苹果和微软。现在有一个新的、更令人沮丧的解释。未来的计算机用户不是一个人。或者至少不仅仅是一个人。机器人即将登陆桌面。有趣的是,坡道已经在那里了。它们被称为辅助功能 API。如果您使用 Mac 并打开系统内置的辅助功能检查器工具(您确实应该尝试一下),您可以看到隐藏在第一个版本内的计算机的第二个版本。第一个版本就是您所看到的:窗口、阴影、圆角矩形、Dock 中来自 Slack 的一个弹跳小图标,宣布您落后了。第二个版本是一棵树。对象的字面层次结构。窗户。团体。按钮。文本字段。滚动区域。静态文本。每个对象都有属性。有些有价值观。有的有行动。有些会告诉你他们在哪里。有些会告诉你它们包含什么。有些会让你根本不用移动鼠标就可以按下它们。这并不是计算机最初设计的使用方式,如果“使用”的意思是“由视力正常的人移动指针来使用”。这就是计算机必须暴露给不能依赖像素的人的方式。 VoiceOver 需要它。开关控制需要它。听写系统需要它。操作系统必须学会描述自己。现在代理商也需要它。您可以在 OpenAI 的 Codex Computer Use 功能中最清楚地看到这一点,该功能在 macOS 上不仅仅是截屏。它还从最前面的窗口中提取“可用文本”,包括应用程序在可见滚动区域之外提供的文本,也就是说,技术上根本不在屏幕上的内容。它还允许代理与您的整个 Mac 进行交互,而不会中断您的使用,因为它有自己的独立鼠标,可以在后台工作。 OpenAI 于 2025 年 10 月收购了创建此项目的公司:一家名为 Software Applications Incorporated 的 12 人商店,其产品 Sky 从未公开发布。萨姆·奥尔特曼亲自投资了种子轮。创始人此前曾将 Workflow 出售给苹果公司,并在苹果公司更名为 Shortcuts。 OpenAI 获得的一笔未公开但显然是真实金额的资金是该团队对 AI 模型驱动 Mac 的正确方式的押注。看来这个赌注是正确的。今天在 Codex 中运行的二进制文件仍名为 SkyComputerUseClient 。在这一部分,你可能会期望我说 macOS 突然对代理如此有利的原因是可访问性 API。但这并不是故事的全部。 Windows 具有辅助功能 API。 Linux 具有可访问性 API。 API 很容易获得。你把它们写在头文件中,在会议上讨论它们,然后在接下来的二十年里解释为什么没有人正确使用它们。 macOS 之所以遥遥领先,是因为默认设置。当大部分内容在 20 世纪 90 年代末被焊接到位时,苹果公司并没有预料到一只估值超过 8000 亿美元的随机鹦鹉有一天需要更改 Finder 中的设置。 Apple 刚刚决定,如果您使用 NSButton 、 NSTextField 、 WKWebView 等普通 Mac 控件构建普通 Mac 应用程序,那么您的应用程序默认情况下应该是可访问的。开发商无需做任何事情。他们编写了一个常规应用程序,并免费获得了高保真可访问性树,因为苹果将合规成本放入了 SDK 而不是应用程序中。盲人用户得到了树。这么多年过去了,意外的受益者是 Codex。回想起来,这是一种道德担忧也与基础设施有关的情况。在大多数软件历史中,大多数工程团队都将可访问性视为一项合规性苦差事、一种善意的行为,或者是如果有时间的话最终会得到的东西,但实际上从来没有,因为唯一真正受到保护的功能是影响某人奖金的功能。这一直都是错误的!但现在它以一种富人可以理解的方式是错误的。糟糕的可访问性树不再仅排除禁用用户。它还排除代理。意外的是,可访问性变成了代理兼容性。代理商现在是新客户。历史对动机并不感伤。可访问性树是为辅助技术而构建的,现在机器中的机器人想要使用它来预订航班。而在这一领域,Mac 确实遥遥领先。瓦