我们是否是一个超级智能程序员创造的人工智能,这位程序员生活在他们为自己构建的模拟中,以此来保护自己免受我们可能在某个时刻变得有意识而对他们构成的潜在威胁?
返回首页
最新
嗨,HN,
在过去的一年里,我一直在使用PostgreSQL构建许多产品,并且不断需要一种非常简单的方法来快速检查表格、运行查询以及验证数据,而不必打开一个沉重的数据库客户端。
因此,我为自己开发了一个小工具,叫做Fakebase——一个轻量级的PostgreSQL浏览器,适用于本地和开发数据库。
我已经每天使用它一段时间了,几位同事也开始使用它,这让我觉得它可能对其他人也有用。
所以我稍微整理了一下,决定分享出来。
我很好奇是否还有其他人遇到同样的问题,或者大家在这个工作流程中更喜欢使用什么工具。
在构建 Latch 这个治理和可观察性平台时,我们的目标是为处理敏感操作的代理提供端到端的测试方案。这意味着需要为代理提供真实的、受管控的身份:电子邮件、电话、支付信息和秘密——所有这些都与一个可审计的实体相绑定。
这个测试平台最终演变成了 Clawcard。
通过一个 API 密钥,您的代理可以获得:
- 一个真实的电子邮件收件箱(发送和接收)
- 一个短信电话号码
- 带消费限额的虚拟 Mastercard
- 一个加密的凭证库
- 每个操作的完整审计记录
所有这些都是为代理原生治理而构建,并能够与 @openclaw 和 [http://runlatch.sh](http://runlatch.sh) 无缝协作。
嗨,HN!我们正在构建“时间机器”,一个用于AI代理的调试和重放平台。我们非常希望听到您的反馈。
这里是一个演示: [https://youtu.be/KyOP9BY0WiY](https://youtu.be/KyOP9BY0WiY)
网站链接:[https://timemachinesdk.dev/](https://timemachinesdk.dev/)
我们试图解决的初始问题是:想象一下,一个代理正在运行到第9步(共10步),它产生了错误的工具调用,向您的数据库写入了垃圾数据,并崩溃了。您修复了提示,然后重新运行。$1.50就这样消失了。在午餐前,这种情况发生了六次。对于在生产环境中运行非平凡工作流的团队来说,每天花费超过100美元在重跑上是很正常的。
我们围绕一个想法构建了“时间机器”:当代理在第9步失败时,您应该能够从第8步分支,并仅重放下游的内容。
如何实现:只需插入TypeScript SDK(或LangChain回调适配器以实现零代码集成),每一步都会被记录——输入、输出、LLM调用、工具调用、完整状态——并持久化到PostgreSQL。仪表板为您提供执行的时间线和有向无环图(DAG)。在任何时候,您都可以分支,修改某些内容(更换模型、编辑提示、调整输入),仅重放下游步骤,并并排比较两次运行的差异。
我们不断回归的内部框架是:为代理执行提供Git支持。检查点、分支、差异、重放。
我们已经看到的一些重叠工具有:LangSmith、Helicone和LangFuse。它们都是不错的工具,但主要是记录器。可观察性是必要的,但在您真正需要的是修改某些内容并查看结果时,它并不足够,而这正是我们使您能够轻松做到的。
我们还提供了原生的Claude Code集成。只需安装一次钩子桥接,每个Claude Code会话都会自动被捕获为“时间机器”执行:工具调用、令牌计数、文件编辑、git上下文、子代理树。您可以在同一个仪表板上获得对Claude Code工作流的全面可观察性,拥有相同的时间线和分支工具,而无需任何手动仪器。此外,我们正在积极开发直接从终端启用“时间机器”的功能,这样您就可以请求Claude Code提取失败的运行,检查追踪,并建议修复,而无需离开您的编辑器。我们的目标是让调试循环保持在开发循环所在的地方。
我们还在同一基础设施上构建一个评估平台。生产运行会自动转化为测试用例。您可以对重放的输出运行断言(包含、正则表达式、余弦相似度、LLM作为评判者、延迟和成本约束),并将其集成到CI/CD中,以便在发布之前测试提示的更改。
当前状态:
MVP已上线——执行捕获、会话重放、分支/重放和Claude Code集成。评估平台正在发布中。SDK是零依赖的。
我们希望与积极调试生产代理的团队合作,成为早期设计合作伙伴。如果您在大规模上面临这个问题,我们非常乐意深入探讨。我们希望人们能够亲自体验这个平台,针对真实的代理运行进行测试,并告诉我们什么可以真正帮助我们消除手动基础设施和代理管理的负担,让您能够专注于快速迭代和实现价值。
我在47岁时被诊断为注意力缺陷多动障碍(ADHD)。在诊断之后,我开始注意到大多数生产力工具都假设用户具有持续的执行功能,而这正是ADHD所干扰的。因此,我构建了一个不同的工具。
DopaLoop是一款iOS习惯追踪器,它以目标(如“改善睡眠”、“减少压力”)为起点,并允许你将习惯与这些目标关联。如果错过一天,系统不会重置。目标始终可见,作为一个锚点或北极星。这个理念是,时间上的模式比每天的连续记录更重要。
技术方面:使用SwiftUI和SwiftData,结合Foundation框架和CoreML,完全本地化,无需后端,无需账户。隐私不仅仅是一个营销决策,实际上我只是希望没有人,包括我自己和我的孩子,担心他们的数据。所有数据都保留在设备上。
提供14天的免费试用,以帮助用户获得一些动力并从分析中获得洞察。没有广告,没有数据收集。
源代码不公开,但我很乐意回答关于SwiftUI/SwiftData架构、HealthKit集成或针对ADHD的设计决策的问题。
dopaloop.app (https://dopaloop.app)
祝好,
Steviee