1作者: arter452 个月前原帖
想象一下,你从一个API“合同”开始,比如Swagger规范。<p>你使用生成器自动将该规范转换为样板代码。<p>但是接下来你需要添加业务逻辑、身份验证等内容。<p>当API规范发生变化时,你该怎么办?你会重新运行生成器吗?如果不这样做,你如何确保你的代码符合规范?
3作者: stugreen132 个月前原帖
简而言之;我构建了一个工具,可以将任何API转换为为AI代理设计的命令行界面(CLI)。 --- 厌倦了处理来自MCP服务器的臃肿上下文窗口,以及将整个API文档塞入代理上下文的技能。 命令行界面解决了这个问题,代理只需运行单个命令即可自我发现API所提供的所有功能。 因此,我构建了一个工具,可以为任何API生成CLI。所有的CLI都是用Go语言编写的,快速且轻量,无需依赖。 帮助文本(通过--help标志)是这个工具的杀手级功能:每个命令/端点/参数的所有上下文直接从面向用户的API文档中提取,并经过大语言模型(LLMs)的增强。它与CLI直接捆绑在一起,代理在运行时只获取所需的信息。没有上下文开销,也没有混乱的API调用。 大多数API尚未提供CLI。可以有Opus这种简单的一次性CLI,但构建一个优秀的CLI,具备跨平台的二进制文件、安装脚本、详细的帮助文本和自动更新,既耗时又令人沮丧,尤其是对于每个API都要重复这一过程。随着API的增长,维护也是一大难题。 只需给InstantCLI提供任何API文档的URL,它就能在几分钟内生成一个生产就绪的CLI。它包括所有平台的二进制文件和安装脚本,随着API的变化进行自动更新,设计用于代理的文档增强帮助文本,以及托管服务。
2作者: waleedk2 个月前原帖
1. <i>规格和计划是源代码</i>:规格和计划与源代码一起存储在git中,而不是在聊天记录中。新的代理会阅读arch.md以了解全局视图,然后查看其具体的规格。你总是能知道某个东西为何被构建。 2. <i>三个模型审查每个阶段</i>:Claude、Gemini和Codex几乎能发现完全不同的错误。没有任何单一模型发现超过55%的问题。如果你只用编写代码的模型进行审查,你会错过一半的错误。在交付前发现了20个错误。Claude Code发现了5个错误,Gemini和Codex又发现了15个,包括一个Claude遗漏的严重安全问题。 3. <i>执行流程,而不是建议它</i>。一个状态机强制执行规格 → 计划 → 实施 → 审查 → PR。AI不能跳过步骤。测试必须通过才能继续。AI不会自行遵循计划,你需要设置轨道。 4. <i>注释,而不是编辑</i>。大部分工作是编写指导代码的规格和审查,而不是在开放式聊天中随意修改文件。 5. <i>代理协调代理</i>。一个架构代理会在隔离的git工作树中生成构建代理。你指导架构代理;它再指导构建代理。它们之间是异步消息传递。 6. <i>管理整个生命周期</i>。大多数AI工具帮助你更快地编写代码——这可能只是工作量的30%。其余70%是规划如何进行、审查、集成、部署脚本、管理预生产与生产环境。让AI从规格到PR及之后的整个流程都运行。 <i>总体结果</i>:一名工程师能够完成通常需要3-4人团队才能完成的工作。在10分制中,代码质量比Claude Code高出1.2分。缺点是耗时更长,使用的token更多,但每个PR的费用仍然合理,为1.60美元。 我们已将其开源: https://github.com/cluesmith/codev 更多细节和原始结果: https://cluesmith.com/blog/a-tour-of-codevos/
1作者: simulationship2 个月前原帖
嗨,HN, 我开发了epstein-search,这是一个开源的Python命令行工具和库,用于对公开发布的爱泼斯坦文件(解密的法庭文件、证词、FBI报告和航班记录)进行语义搜索和RAG(检索增强生成)。 我希望能够轻松浏览这些数千页的非结构化法律PDF,而不依赖于付费的第三方服务或将数据来回发送到云提供商。 它的工作原理如下: 运行epstein-search setup会下载约10万个预计算的文档片段和嵌入(使用all-MiniLM-L6-v2),这些都是基于公共的2万份文档语料库。 它将这些导入到zvec(一个本地向量数据库)中,因此索引大约在一分钟内准备就绪。 标准搜索(epstein-search search)会使用sentence-transformers在本地嵌入你的查询,并进行向量相似性搜索。这个步骤是100%离线的,不需要API密钥。 对于对话式RAG模式(epstein-search chat或ask),它使用LiteLLM。你可以将其指向Ollama或LM Studio实例,以实现完全免费的本地和私密的管道,或者接入像Anthropic、OpenAI或Gemini这样的云提供商。 你还可以通过文档类型过滤查询(例如,--doc-type flight_log或--source "FBI"),并将原始源上下文与生成的答案一起输出,以验证LLM的声明。 该数据集严格来源于公共领域发布的资料(美国司法部、众议院监督委员会、解密的联邦法院文件)。 代码库链接:<a href="https://github.com/simulationship/epstein-search" rel="nofollow">https://github.com/simulationship/epstein-search</a> 我很想听听你的想法、对代码的反馈,或者任何改善本地RAG管道的建议!欢迎随时提问。
1作者: steelbrain2 个月前原帖
嗨,HN!<p>我对在会议室或家庭办公室布线所需的长USB电缆和管道感到非常不满。此外,似乎macOS上可用的无线网络摄像头选择也不多。而且,网络摄像头的价格远高于同类的IP摄像头,后者现在基本上已经成为商品产品。<p>所以我在周末开发了LemurCam(网站:lemur.cam)。它运行得非常好!延迟极小,您可以使用任何现成的摄像头。我正在使用一款TP-Link Tapo,价格大约20欧元。为了实现这一点,我不得不构建一些开源技术,相关信息也在仓库的README文件中。总体来说,这对我来说效果很好,消除了USB布线的需求。<p>我希望它对您也有效!这是免费的,请试试看,并告诉我您的体验如何!