3作者: CMLewis1 天前原帖
嗨,HN,我们是Lewis和Edgar,正在开发Captain,以简化非结构化数据搜索(<a href="https://runcaptain.com">https://runcaptain.com</a>)。Captain自动化构建和维护基于文件的RAG管道。它能够索引云存储服务,如S3和GCS,以及SaaS来源,如Google Drive。您可以在这里查看快速演示:<a href="https://youtu.be/EIQkwAsIPmc" rel="nofollow">https://youtu.be/EIQkwAsIPmc</a>。 我们还创建了一个名为“Ask PG’s Essays”的演示网站,您可以在这里询问/搜索PG的论文集,以了解其工作原理:<a href="https://pg.runcaptain.com">https://pg.runcaptain.com</a>。设置这个RAG部分大约花费了Captain 3分钟。 以下是一些示例提示,以帮助您体验这个过程: “我们什么时候做一些不具规模的事情?我们应该在何时更加谨慎?” <a href="https://pg.runcaptain.com/?q=When%20do%20we%20do%20things%20that%20don%27t%20scale%3F%20When%20should%20we%20be%20more%20cautious%3F">https://pg.runcaptain.com/?q=When%20do%20we%20do%20things%20...</a> “给我一些建议,我正在筹款” <a href="https://pg.runcaptain.com/?q=Give%20me%20some%20advice%2C%20I%27m%20fundraising">https://pg.runcaptain.com/?q=Give%20me%20some%20advice%2C%20...</a> “Lisp最大的优势是什么?” <a href="https://pg.runcaptain.com/?q=what%20are%20the%20biggest%20advantages%20of%20Lisp">https://pg.runcaptain.com/?q=what%20are%20the%20biggest%20ad...</a> 构建一个良好的生产RAG管道需要大量的努力,尤其是对于文件工作负载。您需要处理ETL或文本提取、分块、嵌入、存储、搜索、重新排序、推理,通常还要考虑合规性和可观察性——所有这些都需要在优化延迟和可靠性的同时进行管理。这是一项庞大的工作。在某些情况下,grep工作得很好,但对于代理而言,语义搜索提供了显著更高的性能。Cursor使用了两者,并报告了基于向量搜索相较于grep的6.5%–23.5%的准确率提升(<a href="https://cursor.com/blog/semsearch" rel="nofollow">https://cursor.com/blog/semsearch</a>)。 在过去的四年中,我们为公司扩展RAG管道,而Edgar在普渡大学NLP实验室的工作直接影响了我们的分块技术。在与数十位工程师的交谈中,我们反复看到DIY管道产生不一致的结果,即使经过数周的调整。许多团队对哪种检索策略最适合他们的数据缺乏清晰的认识。 我们意识到,一个能够提供存储和嵌入、处理索引并持续更新管道以反映最新搜索技术的系统,可以消除每个团队自行重建RAG的需求。这个想法最终形成了Captain。 在实际操作中,一个API调用可以索引URL、云存储桶、目录或单个文件。在后台,我们将所有内容转换为Markdown。为此,我们在图像方面使用Gemini 3 Pro,在复杂文档方面使用Reducto,在基本OCR方面使用Extend。对于嵌入模型,最初‘gemini-embedding-001’表现尚可,但后来我们切换到了‘voyage-context-3’的上下文化嵌入。它产生的相关结果甚至比更新的Voyage 4模型更好,因为它的块嵌入考虑了周围文档的上下文。然后,我们应用了Voyage的‘rerank-2.5’作为第二阶段的重新排序,将50个初始块减少到最终的15个(可在Captain的API中配置)。稠密嵌入只是整个图景的一部分,而与RRF的全文搜索则完善了我们的混合检索。在Captain API中,这些技术通过一个单一的/query端点暴露。访问控制可以通过元数据过滤器进行配置,页码引用会自动返回。 技术栈不断变化,但Captain API为此创建了一个标准接口。您可以免费试用Captain一个月,并在<a href="https://runcaptain.com">https://runcaptain.com</a>上构建自己的管道。我们期待真诚的反馈,尤其是任何可以使其更有用的建议,并期待您的评论!
10作者: visekr1 天前原帖
嗨,HN - 我是Ryan,一名会编程的产品设计师,我开发了Mesa。当前的集成开发环境(IDE)对于现在的开发方式来说感觉不太合适——它们仍然专注于文件。 Mesa将重点放在整个工作流程上:你的代理、终端、浏览器和文件都作为平等的节点存在于一个画布上,并支持完整的多人协作。(可以想象成是为代码设计的Figma) 我厌倦了在多个项目之间切换窗口、标签和终端的繁琐。受到TouchDesigner和Factorio的启发,我想要一种更流畅、更直观的工具。现在我每天在工作中完全用它替代Cursor。能够同时查看多个代码库,并在每个代码库上控制代理,而无需切换窗口,这让我释放了思维空间,提高了工作效率。 欢迎免费试用——我很想知道你的想法!
1作者: siris9501 天前原帖
我开发了一个小型网络工具,旨在自动将杂乱的提示重构为结构化的提示规范。<p>其动机很简单:大多数人编写的提示结构较差,这常常导致不稳定的人工智能响应。<p>因此,我实现了一个提议者-批评者-验证者优化流程。<p>提议者重构提示。批评者评估清晰度、结构和任务定义。验证者检查一致性。仲裁者检测收敛。<p>该系统运行多个迭代,生成结构化的提示规范。<p>完整的优化循环通常需要大约30到40秒。<p>该工具还包括: • 提示质量分析 • 解释模式 • 版本历史 • 提示差异查看器<p>演示: <a href="https:&#x2F;&#x2F;how-to-grab-me.vercel.app&#x2F;" rel="nofollow">https:&#x2F;&#x2F;how-to-grab-me.vercel.app&#x2F;</a><p>希望听到使用AI工具的人是否觉得这样的工具有用。