返回首页
最新
如果你使用 Claude Code、Cursor 或 ChatGPT,你已经了解了冷启动问题。每次对话都是从零开始。即使使用 MCP 连接器,你也只能从特定工具(如 Slack、Linear、GitHub)中提取信息,但它们都不知道你五分钟前在做什么。你最终仍然需要输入“我正在进行支付重构,我刚刚修改了三个文件,Sarah 在 Slack 上批准了定价,工单是 PROD-847。”
lurk 解决了这个问题。它是一个本地的 macOS 守护进程,持续观察你的桌面——窗口标题、通过 OCR 获取的屏幕内容、git 差异、日历、输入状态——并为任何 AI 工具提供统一的上下文。不是逐个连接器,而是一次性自动提供所有信息。
与连接器的区别在于:Slack MCP 让你访问消息,但哪些消息呢?你有 47 个频道。Google Drive 提供文档,但现在哪个文档重要?lurk 知道,因为它观察到你在阅读定价文档,然后切换到 Slack 与 Sarah 讨论,再打开 VS Code 进行实现。它连接了单个连接器无法连接的点。
它的工作原理:
- Swift 守护进程每 ~3 秒轮询一次(窗口标题、屏幕截图、输入状态)
- Python 引擎丰富事件——30 多个特定应用的解析器、活动分类、通过 macOS Vision 进行 OCR
- 启动时读取你项目的 README,以便了解项目的实际内容
- Git 监视器捕获实际差异——实际的代码更改,而不仅仅是文件名
- 为 Claude Code/Cursor 提供 MCP 服务器,其他所有功能通过 localhost:4141 的 HTTP API
- Chrome 扩展程序可一键将上下文注入到 Claude、ChatGPT、Gemini
- 可选的本地 LLM(Ollama)将活动聚合成连贯的工作线程
它不做的事情:
- 没有云。所有数据保留在你的机器上。
- 没有遥测。无需账户。无需 API 密钥。
- 不会将你的屏幕内容发送到任何地方——消费 AI 工具在本地读取它。
使用命令:npx lurk-cli onboard
GitHub 地址: [https://github.com/lurk-cli/lurk](https://github.com/lurk-cli/lurk)
我是一名经验丰富的工程经理,简历上有大公司的经历以及两家初创公司的背景。我在2023年辞职,时机不太好,恰好在大规模裁员开始的时候。我目前在一家初创公司工作,但资金快要耗尽了。我正在努力争取面试机会,但到目前为止运气不佳。
我在系统设计方面相当不错,但编程有些生疏。人工智能确实有帮助,但做leetcode题目又是另一场战斗。
我不知道发生了什么,但我在申请系统(ATS)中大多数情况下都被自动拒绝。到目前为止,只有一位招聘人员因为我不符合公民身份标准而拒绝了我。我的网络中大多数人都被裁员了,或者没有回应。曾经的同事友谊似乎也没什么用。
我在考虑通过LinkedIn联系招聘人员。但我想,其他人也在联系他们,他们肯定很忙。对我来说,主动联系并请求这样的帮助也很尴尬。
所以我有一个问题想问那些最近找到工作的经理们:你们是怎么做到的?
它的功能:通过信任治理层(VERITAS)运行AI代理(分诊、订单、实验室审核、药房、文档)以支持临床接触。每个代理的操作都受到政策的限制(OPA Rego),并以FHIR R4格式持久化,同时经过加密审计。
关键设计决策:
- 默认拒绝 — 代理在没有政策批准的情况下无法行动
- 人工干预的门槛由政策强制执行,而非用户界面约定
- FHIR R4作为原生数据模型(无专有架构)
- 加密审计链(SHA-256,追加只读)
- 可插拔的LLM后端(Claude API / Ollama / mock)
技术栈:Rust, axum 0.7, tokio, regorus (Rego), sqlx, reqwest, Next.js 15
并非试图取代Epic — 而是利用AI解决Epic在架构上无法解决的问题。
演示链接:https://screen.studio/share/VjDVsjUG
VERITAS GitHub仓库:https://github.com/Chesterguan/veritas
还有其他人每天都在经历 GitHub 的持续可靠性问题吗?在过去的 2-3 个月里,我一直在处理一系列不断出现的问题:速率限制、Copilot 不稳定、重大故障,以及隧道和 Codespaces 的反复问题。这已经成为一个真正的生产力隐患。
我们是否是一个超级智能程序员创造的人工智能,这位程序员生活在他们为自己构建的模拟中,以此来保护自己免受我们可能在某个时刻变得有意识而对他们构成的潜在威胁?
嗨,HN,
在过去的一年里,我一直在使用PostgreSQL构建许多产品,并且不断需要一种非常简单的方法来快速检查表格、运行查询以及验证数据,而不必打开一个沉重的数据库客户端。
因此,我为自己开发了一个小工具,叫做Fakebase——一个轻量级的PostgreSQL浏览器,适用于本地和开发数据库。
我已经每天使用它一段时间了,几位同事也开始使用它,这让我觉得它可能对其他人也有用。
所以我稍微整理了一下,决定分享出来。
我很好奇是否还有其他人遇到同样的问题,或者大家在这个工作流程中更喜欢使用什么工具。
在构建 Latch 这个治理和可观察性平台时,我们的目标是为处理敏感操作的代理提供端到端的测试方案。这意味着需要为代理提供真实的、受管控的身份:电子邮件、电话、支付信息和秘密——所有这些都与一个可审计的实体相绑定。
这个测试平台最终演变成了 Clawcard。
通过一个 API 密钥,您的代理可以获得:
- 一个真实的电子邮件收件箱(发送和接收)
- 一个短信电话号码
- 带消费限额的虚拟 Mastercard
- 一个加密的凭证库
- 每个操作的完整审计记录
所有这些都是为代理原生治理而构建,并能够与 @openclaw 和 [http://runlatch.sh](http://runlatch.sh) 无缝协作。
嗨,HN!我们正在构建“时间机器”,一个用于AI代理的调试和重放平台。我们非常希望听到您的反馈。
这里是一个演示: [https://youtu.be/KyOP9BY0WiY](https://youtu.be/KyOP9BY0WiY)
网站链接:[https://timemachinesdk.dev/](https://timemachinesdk.dev/)
我们试图解决的初始问题是:想象一下,一个代理正在运行到第9步(共10步),它产生了错误的工具调用,向您的数据库写入了垃圾数据,并崩溃了。您修复了提示,然后重新运行。$1.50就这样消失了。在午餐前,这种情况发生了六次。对于在生产环境中运行非平凡工作流的团队来说,每天花费超过100美元在重跑上是很正常的。
我们围绕一个想法构建了“时间机器”:当代理在第9步失败时,您应该能够从第8步分支,并仅重放下游的内容。
如何实现:只需插入TypeScript SDK(或LangChain回调适配器以实现零代码集成),每一步都会被记录——输入、输出、LLM调用、工具调用、完整状态——并持久化到PostgreSQL。仪表板为您提供执行的时间线和有向无环图(DAG)。在任何时候,您都可以分支,修改某些内容(更换模型、编辑提示、调整输入),仅重放下游步骤,并并排比较两次运行的差异。
我们不断回归的内部框架是:为代理执行提供Git支持。检查点、分支、差异、重放。
我们已经看到的一些重叠工具有:LangSmith、Helicone和LangFuse。它们都是不错的工具,但主要是记录器。可观察性是必要的,但在您真正需要的是修改某些内容并查看结果时,它并不足够,而这正是我们使您能够轻松做到的。
我们还提供了原生的Claude Code集成。只需安装一次钩子桥接,每个Claude Code会话都会自动被捕获为“时间机器”执行:工具调用、令牌计数、文件编辑、git上下文、子代理树。您可以在同一个仪表板上获得对Claude Code工作流的全面可观察性,拥有相同的时间线和分支工具,而无需任何手动仪器。此外,我们正在积极开发直接从终端启用“时间机器”的功能,这样您就可以请求Claude Code提取失败的运行,检查追踪,并建议修复,而无需离开您的编辑器。我们的目标是让调试循环保持在开发循环所在的地方。
我们还在同一基础设施上构建一个评估平台。生产运行会自动转化为测试用例。您可以对重放的输出运行断言(包含、正则表达式、余弦相似度、LLM作为评判者、延迟和成本约束),并将其集成到CI/CD中,以便在发布之前测试提示的更改。
当前状态:
MVP已上线——执行捕获、会话重放、分支/重放和Claude Code集成。评估平台正在发布中。SDK是零依赖的。
我们希望与积极调试生产代理的团队合作,成为早期设计合作伙伴。如果您在大规模上面临这个问题,我们非常乐意深入探讨。我们希望人们能够亲自体验这个平台,针对真实的代理运行进行测试,并告诉我们什么可以真正帮助我们消除手动基础设施和代理管理的负担,让您能够专注于快速迭代和实现价值。