屏忆：这款开源工具，把过目就忘的日常变成「上下文」

屏忆：这款开源工具，把过目就忘的日常变成「上下文」主作者关注少数派71601116 少数派作者少数派71601116 关注少数派71601116 少数派作者联合作者关注少数派71601116 少数派作者少数派71601116 关注少数派71601116 少数派作者 15:10 利益相关声明：作者与文中产品有直接的利益相关（开发者、自家产品等）我经常遇到一种很具体的遗忘：明明知道自己之前在手机上看到过某个东西，却完全想不起它来自哪个 App、出现在哪一天、存在于哪个页面。更麻烦的是我通常没有截图来帮我回忆，那些内容只是当时恰好看到，没有收藏、没有转发、也没有写进笔记。后来想找，连一个可以回去的入口都没有。一开始我只是觉得烦，后来我慢慢意识到，这件事可能比「找不到截图」更大一点：如果将来每个人都能拥有自己的 AI 助手，它能不能理解你不只取决于模型有多强，也取决于你给它留下过多少真实的上下文。今天没有留下来的东西，明天很难补上。所以我开始做屏忆（ScreenMemo），一个开源的本地屏幕记忆工具：自动记录屏幕内容，然后通过 OCR、搜索、时间线、每日总结和 AI 回顾，把那些原本滑走、然后遗忘的内容，变成可以找回的线索。屏忆会按应用组织已经记录下来的屏幕内容。对我来说，先有一个能回到过去画面的入口，比一开始就追求复杂整理更重要。屏忆的基础工作流程并不神秘：通过无障碍服务定时截屏，然后把截图保存在本地，同时记录当前应用、时间和路径；对截图做 OCR 并建立本地索引后，在 App 里提供搜索、图库、收藏、时间线、动态总结、每日总结和 AI 回顾。它最直接的场景，是找回那些你觉得「我明明看过」、但记忆相对模糊的内容。比如昨天在信息流里刷到过一个有用的方法，隔天想再看时却发现没有收藏，想不起作者、也想不起标题。放在过去，我大概会翻浏览记录、重新搜关键词，或者干脆等它哪天再次被推荐。屏忆的做法更粗暴一点：如果当时屏幕被记录下来，OCR 文本进入了本地索引，之后就可以搜索那几个模糊的关键词，再回到对应截图确认。第二种情况是找回一段过程。有些操作不是一张截图能说明白的。注册、登录、授权、付款、查询、客服沟通，都可能跨过好几个页面。单张截图只能告诉你某一刻屏幕上有什么，时间线能把前后关系补回来。屏忆支持按时间回看，也可以生成回放，用来还原一次操作路径。单张截图解决「那一刻有什么」，时间线和回放更接近「当时我是怎么走到这里的」。还有每天的回顾。如果你一直在手机上查资料、沟通、处理事情，屏幕内容本身也会留下了不少线索。每日总结不是日记，只是先把一天里零散的记录整理成一份能读的摘要。它不一定深刻，但至少能回答一个朴素的问题：今天我大概看过什么、处理过什么。 AI 回顾也是类似思路。普通 AI 助手并不知道你昨天在手机上看过什么。屏忆在你配置 AI 提供商后，可以基于截图、动态总结、上下文片段和你明确选择的证据图片做回顾。你可以问它「下午那段流程大概在做什么」，也可以让它帮你从一组截图里整理出重点。这里的 AI 不是凭空聊天，它只会将你已经留下的屏幕线索作为上下文。最后，屏忆也支持收藏和备注。自动记录负责兜底，但有些内容还是要人来标一下，看到值得留下的截图，你可以加一句自己的说明。这个功能小但必要，自动记录再多也替代不了人的判断。如果要找一个参照物，屏忆和一些桌面端自动记录屏幕的工具有点像。比如我经常想到 Rewind ，它早期的方向和屏忆很接近，记录 Mac 上看过、听过的内容，再用 OCR 和语音识别做搜索。这个想法很诱人，也确实说明桌面端早就有人在尝试「屏幕记忆」。只是后来的故事有点复杂：Rewind 在 2024 年转向 Limitless ，开始做会议记录和录音吊坠；2025 年被 Meta 收购后， Limitless 官方说明写明 Rewind 应用会逐渐停止运营，最新版从 2025 年 12 月 19 日起已经禁用了屏幕和音频捕获。 Rewind 早期主打「记录你在 Mac 上做过的一切」，这和屏幕记忆的方向很接近。 Rewind 的事不是一句「产品失败」就能概括的，商业产品会转向、会被收购、会砍掉特定功能，开发团队有自己的选择。但对个人记忆库来说，这些「意外」的影响会变得十分具体，它们的理想状态是长期记录，但这些产品本身未必长期存在。后续微软的 Recall 则补上了另一层提醒：它同样想把电脑上出现过的内容做成可搜索的时间线；2024 年遇到隐私和安全方面的质疑后，微软在官方博客里说，Recall 会先进入 Windows Insider 计划，而不是直接随 Copilot+ PC 面向用户提供预览。大公司也绕不开这个问题：只要工具会持续记录屏幕，信任就会跑到功能前面。这张图提醒我：个人记忆工具如果完全依赖闭源产品，生命周期本身就是风险。在手机上几乎没找到同类工具的前提下，偏偏很多最零碎、最容易丢的上下文又都发生在手机上：聊天、搜索、信息流、支付、设置、临时打开的网页。这便是屏忆开发的初心。你的屏幕里可能有聊天、订单、账号、位置、支付流程、工作资料和临时验证码，有了 Rewind、Recall 等功能的「前车之鉴」，屏忆在设计理念上强调本地保存和开源，截图、OCR、索引和大多数配置默认留在本地；代码、实现方式和隐私边界你也能直接在 GitHub 仓库里看到。本地优先也意味着用户必须能把数据带走，屏忆支持导出 ZIP 备份，导入时提供覆盖导入和合并导入。 Recall 的官方说明里也把「快照」「本地保存」「权限控制」放在很前面。只要工具会记录屏幕，信任问题就不会是附属问题。屏忆还提供隐私模式、敏感内容分析和 NSFW 相关能力。这不是猎奇功能，而是长期记录屏幕以后必须面对的问题。一个记忆工具不能只会保存，也要能遮挡、限制和删除。存储方面，自动截图的数据是长期增长的，按压缩后约 50 KB 一张、每分钟一张粗算，30 天大约是 43200 张截图，约 2.1 GB。这个数字不算夸张但会持续增长，所以屏忆不能只负责保存。它还要提供目标大小压缩、历史压缩、过期清理、存储分析和按应用策略。你可以只记录真正需要的 App，也可以定期清理不再需要的截图。屏忆的设置页自上线以来变得越来越长，一开始我也有点犹豫：设置太多会不会显得复杂？但做了一段时间后，我觉得这些开关不能省。因为屏忆记录的是屏幕，很多选择不应该由工具替用户决定：哪些 App 要进入记忆库、哪些内容需要自动遮挡、AI 请求发给哪个模型、提示词怎么写、请求日志要不要保留……甚至要不要把本地记忆通过 MCP 暴露给同一局域网里的 AI 客户端，这些都应该是明确的选择，而不应该藏在默认行为里。所以屏忆把 AI 能力被做成了可选项。只有在你启用 AI 并配置提供商后，相关总结或对话请求才会发往你配置的模型服务。这会增加配置门槛，但我更愿意把选择权留给用户，你可以配置 OpenAI、Claude、Gemini 或兼容接口的服务，也可以调整 Prompt，查看请求日志和工具调用报告。这样做不如「打开即用」顺滑，但出了问题时，你至少知道一次总结用了哪些图