返回首页
24小时热榜
嗨,我是作者,Screenmind 是一个以隐私为首要考虑的 Microsoft Recall 替代品。它运行在 Gemma 4 上,这是少数支持视觉、音频和推理三者的模型之一,因此您的数据永远不会离开您的设备。
使用 Screenmind,您可以跟踪您的时间线,记录您在每项任务上花费的时间……可以搜索任何带有文本的截图……最酷的是,您可以与您的屏幕历史进行对话,比如“亚历克斯在 Discord 上给我发了什么消息?”或者“我是否收到了来自 Microsoft 的邮件?”如果它出现在您的屏幕上,您可以在聊天中提问。此外,您还可以在此基础上创建自动化,比如“在 Slack 上给我发送整天的报告”(它支持集成)……您还可以用简单的英语编写自动化,适合非程序员,或者使用 Python 供想深入了解的开发者使用。您可以通过快捷键保存语音备忘录(附带截图),并自动转录和总结会议(自动检测会议)。
我面临的最大挑战是将 Screenmind 作为后台服务持续运行,如果没有聊天功能,这并不会太困难,因为运行本地模型需要计算资源……持续分析截图会占用所有资源。为此,我想出了一个感知哈希缓存……这个三层缓存系统可以将平均用户的推理时间减少多达 40%(也就是我)。为了进一步减少推理时间,我设计了三种模式:快速、平衡和准确,权衡在于时间和准确性。
目前,我在我的 4GB GTX 1650 显卡上每天使用快速模式,效果相当不错,当然在高端机器上会更快。它还配有 MCP 服务器,因此您可以直接询问 Claude Desktop/Cursor 关于您早上看到的错误。
支持 Windows/Mac/Linux。
坦率地说,它在 Mac 上的测试不够全面,安装过程也有些摩擦,因此我正在开发一键安装程序。
(重发 - 我几个月前发布了一个早期版本,由于新账户评论被标记,因此无法回复任何评论)
代码库:github.com/ayushh0110/ScreenMind
对如何实现多显示器支持有任何想法的人请告诉我。