汽车 morning

屏忆:这款开源工具,把过目就忘的日常变成「上下文」

2026-05-27 1 阅读 少数派71601116
屏忆:这款开源工具,把过目就忘的日常变成「上下文」 主作者 关注 少数派71601116 少数派作者 少数派71601116 关注 少数派71601116 少数派作者 联合作者 关注 少数派71601116 少数派作者 少数派71601116 关注 少数派71601116 少数派作者 15:10 利益相关声明:作者与文中产品有直接的利益相关(开发者、自家产品等) 我经常遇到一种很具体的遗忘:明明知道自己之前在手机上看到过某个东西,却完全想不起它来自哪个 App、出现在哪一天、存在于哪个页面。更麻烦的是我通常没有截图来帮我回忆,那些内容只是当时恰好看到,没有收藏、没有转发、也没有写进笔记。 后来想找,连一个可以回去的入口都没有。 一开始我只是觉得烦,后来我慢慢意识到,这件事可能比「找不到截图」更大一点:如果将来每个人都能拥有自己的 AI 助手,它能不能理解你不只取决于模型有多强,也取决于你给它留下过多少真实的上下文。今天没有留下来的东西,明天很难补上。 所以我开始做 屏忆(ScreenMemo) ,一个开源的本地屏幕记忆工具:自动记录屏幕内容,然后通过 OCR、搜索、时间线、每日总结和 AI 回顾,把那些原本滑走、然后遗忘的内容,变成可以找回的线索。 屏忆会按应用组织已经记录下来的屏幕内容。对我来说,先有一个能回到过去画面的入口,比一开始就追求复杂整理更重要。 屏忆的基础工作流程并不神秘:通过无障碍服务定时截屏,然后把截图保存在本地,同时记录当前应用、时间和路径;对截图做 OCR 并建立本地索引后,在 App 里提供搜索、图库、收藏、时间线、动态总结、每日总结和 AI 回顾。 它最直接的场景,是找回那些你觉得「我明明看过」、但记忆相对模糊的内容 。 比如昨天在信息流里刷到过一个有用的方法,隔天想再看时却发现没有收藏,想不起作者、也想不起标题。放在过去,我大概会翻浏览记录、重新搜关键词,或者干脆等它哪天再次被推荐。 屏忆的做法更粗暴一点:如果当时屏幕被记录下来,OCR 文本进入了本地索引,之后就可以搜索那几个模糊的关键词,再回到对应截图确认。 第二种情况是找回一段过程。 有些操作不是一张截图能说明白的。注册、登录、授权、付款、查询、客服沟通,都可能跨过好几个页面。单张截图只能告诉你某一刻屏幕上有什么,时间线能把前后关系补回来。屏忆支持按时间回看,也可以生成回放,用来还原一次操作路径。 单张截图解决 「 那一刻有什么 」 ,时间线和回放更接近 「 当时我是怎么走到这里的 」 。 还有每天的回顾 。 如果你一直在手机上查资料、沟通、处理事情,屏幕内容本身也会留下了不少线索。每日总结不是日记,只是先把一天里零散的记录整理成一份能读的摘要。它不一定深刻,但至少能回答一个朴素的问题:今天我大概看过什么、处理过什么。 AI 回顾也是类似思路 。 普通 AI 助手并不知道你昨天在手机上看过什么。屏忆在你配置 AI 提供商后,可以基于截图、动态总结、上下文片段和你明确选择的证据图片做回顾。你可以问它「下午那段流程大概在做什么」,也可以让它帮你从一组截图里整理出重点。这里的 AI 不是凭空聊天,它只会将你已经留下的屏幕线索作为上下文。 最后,屏忆也支持收藏和备注 。自动记录负责兜底,但有些内容还是要人来标一下,看到值得留下的截图,你可以加一句自己的说明。这个功能小但必要,自动记录再多也替代不了人的判断。 如果要找一个参照物,屏忆和一些桌面端自动记录屏幕的工具有点像。比如我经常想到 Rewind ,它早期的方向和屏忆很接近,记录 Mac 上看过、听过的内容,再用 OCR 和语音识别做搜索。这个想法很诱人,也确实说明桌面端早就有人在尝试「屏幕记忆」。只是后来的故事有点复杂:Rewind 在 2024 年转向 Limitless ,开始做会议记录和录音吊坠;2025 年被 Meta 收购后, Limitless 官方说明 写明 Rewind 应用会逐渐停止运营,最新版从 2025 年 12 月 19 日起已经禁用了屏幕和音频捕获。 Rewind 早期主打 「 记录你在 Mac 上做过的一切 」 ,这和屏幕记忆的方向很接近。 Rewind 的事不是一句「产品失败」就能概括的,商业产品会转向、会被收购、会砍掉特定功能,开发团队有自己的选择。但对个人记忆库来说,这些「意外」的影响会变得十分具体,它们的理想状态是长期记录,但这些产品本身未必长期存在。 后续微软的 Recall 则补上了另一层提醒:它同样想把电脑上出现过的内容做成可搜索的时间线;2024 年遇到隐私和安全方面的质疑后,微软在 官方博客 里说,Recall 会先进入 Windows Insider 计划,而不是直接随 Copilot+ PC 面向用户提供预览。大公司也绕不开这个问题:只要工具会持续记录屏幕,信任就会跑到功能前面。 这张图提醒我:个人记忆工具如果完全依赖闭源产品,生命周期本身就是风险。 在手机上几乎没找到同类工具的前提下,偏偏很多最零碎、最容易丢的上下文又都发生在手机上:聊天、搜索、信息流、支付、设置、临时打开的网页。这便是屏忆开发的初心。你的屏幕里可能有聊天、订单、账号、位置、支付流程、工作资料和临时验证码,有了 Rewind、Recall 等功能的「前车之鉴」,屏忆在设计理念上强调本地保存和开源,截图、OCR、索引和大多数配置默认留在本地;代码、实现方式和隐私边界你也能直接在 GitHub 仓库里看到。本地优先也意味着用户必须能把数据带走,屏忆支持导出 ZIP 备份,导入时提供覆盖导入和合并导入。 Recall 的官方说明里也把「快照」「本地保存」「权限控制」放在很前面。只要工具会记录屏幕,信任问题就不会是附属问题。 屏忆还提供隐私模式、敏感内容分析和 NSFW 相关能力。这不是猎奇功能,而是长期记录屏幕以后必须面对的问题。一个记忆工具不能只会保存,也要能遮挡、限制和删除。 存储方面,自动截图的数据是长期增长的,按压缩后约 50 KB 一张、每分钟一张粗算,30 天大约是 43200 张截图,约 2.1 GB。这个数字不算夸张但会持续增长,所以屏忆不能只负责保存。它还要提供目标大小压缩、历史压缩、过期清理、存储分析和按应用策略。你可以只记录真正需要的 App,也可以定期清理不再需要的截图。 屏忆的设置页自上线以来变得越来越长,一开始我也有点犹豫:设置太多会不会显得复杂?但做了一段时间后,我觉得这些开关不能省。 因为屏忆记录的是屏幕,很多选择不应该由工具替用户决定:哪些 App 要进入记忆库、哪些内容需要自动遮挡、AI 请求发给哪个模型、提示词怎么写、请求日志要不要保留……甚至要不要把本地记忆通过 MCP 暴露给同一局域网里的 AI 客户端,这些都应该是明确的选择,而不应该藏在默认行为里。 所以屏忆把 AI 能力被做成了可选项。只有在你启用 AI 并配置提供商后,相关总结或对话请求才会发往你配置的模型服务。这会增加配置门槛,但我更愿意把选择权留给用户,你可以配置 OpenAI、Claude、Gemini 或兼容接口的服务,也可以调整 Prompt,查看请求日志和工具调用报告。这样做不如「打开即用」顺滑,但出了问题时,你至少知道一次总结用了哪些图