3作者: cammasmith25 天前原帖
大型语言模型(LLMs)在SQL方面表现出色。SQL精确、表达能力强且没有歧义。如果将MCP服务器连接到Postgres,代理可以直接查询它。对于NoSQL数据库来说情况就不一样了,考虑到有这么多人使用NoSQL数据库,我对这一话题讨论不多感到惊讶。 问题的一部分在于多样性。MongoDB、DynamoDB、Cassandra、Redis和Neo4j都有不同的查询模型。没有一个共享的接口供LLM进行推理。因此,代理不仅要编写查询,还需要编写代码:SDK调用、手动聚合、分页逻辑。这使得过程变得更加复杂,审查起来也更困难,并且在处理任何非平凡的任务时很快就会出错。 我们在使用DynamoDB时遇到了这个问题,最终构建了自己的解决方案。如果有人感兴趣,我在这里写了相关内容:https://dynamosql.hashnode.dev/why-llm-agents-still-can-t-query-nosql-databases。但我更想知道其他人是如何处理这个问题的。为什么这仍然是一个未解决的问题呢?
1作者: farcaster25 天前原帖
在经历了数百场游戏的失败后,我意识到状态空间足够小,也许可以通过使用PPO训练一个小型神经网络,使其能够相对稳定地获胜。经过一些奖励工程的调整,它成功了!经过PPO训练的神经网络能够击败9%的所有对局,甚至一路打到精英四人组!
1作者: tashadir25 天前原帖
Headroom 是一款菜单栏应用程序,能够悄悄优化 Claude Code 的输入,通过减少提示冗余、去除模板内容以及压缩文档,而不改变您的工作方式。这使得您在已经支付的 Claude 计划上,能够使用约两倍的 Claude Code。与竞争对手不同,Headroom 应用程序完全开源,并且免费使用,非常适合希望最大化其 AI 编码助手投资的开发者和团队。 链接: https://extraheadroom.com/ https://github.com/gglucass/headroom-desktop https://x.com/garmdotcom https://www.instagram.com/extraheadroom/ https://youtu.be/2NPBaqRGcOs
19作者: nab25 天前原帖
嗨,HN,我们是Nick和Drew,我们正在构建boxes.dev——首个纯云端的自主开发环境(ADE),为每个Codex和Claude Code代理提供独立的云计算机。 我们是两名工程师,之前共同创建了Gem(联合创始人/首席技术官及首位员工),在过去的一年里,我们几乎完全依赖Codex和Claude Code进行编码。这对我们的编码方式带来了巨大的变化,看到模型不断进步让人兴奋,但我们最终意识到在本地开发的方式限制了我们: - Git工作树的设置和使用繁琐,难以并行化工作。 - 现在是2026年,但大家仍然在用打开的笔记本电脑或通过SSH连接车库里的Mac mini,以确保他们的代理不会停止工作。 - 尽管编程现在就像发短信一样简单,但移动端仍然被视为附带功能。 当多个并行代理通过在本地运行完整应用程序来测试自己的工作时,我们开始遇到资源限制。我们尝试了不同的产品,但没有找到能够解决我们所有痛点的解决方案,因此我们决定转变思路,自己构建我们想要的ADE。 Boxes.dev是一个桌面和移动应用,允许你在远程计算上运行Claude Code、Codex(使用你的订阅!)以及你正在构建的完整开发环境。它类似于Conductor或Codex桌面应用,但一切都在云端。 我们使用编码代理扫描你的本地开发设置并将其移植到云端。然后每个Claude Code/Codex线程都从完整设置的快照开始,拥有自己的文件系统和计算资源。再也不需要Git工作树,也不再需要打开的笔记本电脑,你的编码代理可以真正进行端到端的测试,因为它们可以在隔离环境中运行你的完整应用。 我们已经将Claude Code和Codex的用户体验进行了镜像,以便让高级用户感到自然,同时还提供了功能齐全的移动应用(没有交接或远程控制),以及定时自动化和Slack集成。 我们显然有偏见,但我们已经用boxes.dev构建了boxes.dev几个月,坦白说,这真的改变了游戏规则。一旦你意识到本地开发对你的限制,就很难再回去;根据早期测试者的反馈,我们越来越确信云端是自主编码的未来。 我们希望你们能亲自体验一下!非常欢迎任何反馈,并乐意在这个讨论中回答任何问题。