HackerNews中文版

嗨，HN，我们是Lewis和Edgar，正在开发Captain，以简化非结构化数据搜索（<a href="https://runcaptain.com">https://runcaptain.com</a>）。Captain自动化构建和维护基于文件的RAG管道。它能够索引云存储服务，如S3和GCS，以及SaaS来源，如Google Drive。您可以在这里查看快速演示：<a href="https://youtu.be/EIQkwAsIPmc" rel="nofollow">https://youtu.be/EIQkwAsIPmc</a>。我们还创建了一个名为“Ask PG’s Essays”的演示网站，您可以在这里询问/搜索PG的论文集，以了解其工作原理：<a href="https://pg.runcaptain.com">https://pg.runcaptain.com</a>。设置这个RAG部分大约花费了Captain 3分钟。以下是一些示例提示，以帮助您体验这个过程： “我们什么时候做一些不具规模的事情？我们应该在何时更加谨慎？” <a href="https://pg.runcaptain.com/?q=When%20do%20we%20do%20things%20that%20don%27t%20scale%3F%20When%20should%20we%20be%20more%20cautious%3F">https://pg.runcaptain.com/?q=When%20do%20we%20do%20things%20...</a> “给我一些建议，我正在筹款” <a href="https://pg.runcaptain.com/?q=Give%20me%20some%20advice%2C%20I%27m%20fundraising">https://pg.runcaptain.com/?q=Give%20me%20some%20advice%2C%20...</a> “Lisp最大的优势是什么？” <a href="https://pg.runcaptain.com/?q=what%20are%20the%20biggest%20advantages%20of%20Lisp">https://pg.runcaptain.com/?q=what%20are%20the%20biggest%20ad...</a> 构建一个良好的生产RAG管道需要大量的努力，尤其是对于文件工作负载。您需要处理ETL或文本提取、分块、嵌入、存储、搜索、重新排序、推理，通常还要考虑合规性和可观察性——所有这些都需要在优化延迟和可靠性的同时进行管理。这是一项庞大的工作。在某些情况下，grep工作得很好，但对于代理而言，语义搜索提供了显著更高的性能。Cursor使用了两者，并报告了基于向量搜索相较于grep的6.5%–23.5%的准确率提升（<a href="https://cursor.com/blog/semsearch" rel="nofollow">https://cursor.com/blog/semsearch</a>）。在过去的四年中，我们为公司扩展RAG管道，而Edgar在普渡大学NLP实验室的工作直接影响了我们的分块技术。在与数十位工程师的交谈中，我们反复看到DIY管道产生不一致的结果，即使经过数周的调整。许多团队对哪种检索策略最适合他们的数据缺乏清晰的认识。我们意识到，一个能够提供存储和嵌入、处理索引并持续更新管道以反映最新搜索技术的系统，可以消除每个团队自行重建RAG的需求。这个想法最终形成了Captain。在实际操作中，一个API调用可以索引URL、云存储桶、目录或单个文件。在后台，我们将所有内容转换为Markdown。为此，我们在图像方面使用Gemini 3 Pro，在复杂文档方面使用Reducto，在基本OCR方面使用Extend。对于嵌入模型，最初‘gemini-embedding-001’表现尚可，但后来我们切换到了‘voyage-context-3’的上下文化嵌入。它产生的相关结果甚至比更新的Voyage 4模型更好，因为它的块嵌入考虑了周围文档的上下文。然后，我们应用了Voyage的‘rerank-2.5’作为第二阶段的重新排序，将50个初始块减少到最终的15个（可在Captain的API中配置）。稠密嵌入只是整个图景的一部分，而与RRF的全文搜索则完善了我们的混合检索。在Captain API中，这些技术通过一个单一的/query端点暴露。访问控制可以通过元数据过滤器进行配置，页码引用会自动返回。技术栈不断变化，但Captain API为此创建了一个标准接口。您可以免费试用Captain一个月，并在<a href="https://runcaptain.com">https://runcaptain.com</a>上构建自己的管道。我们期待真诚的反馈，尤其是任何可以使其更有用的建议，并期待您的评论！

展示HN：Mesa – 一个为以代理为中心的开发而构建的协作画布IDE

10 分•作者: visekr•1 天前•原帖

嗨，HN - 我是Ryan，一名会编程的产品设计师，我开发了Mesa。当前的集成开发环境（IDE）对于现在的开发方式来说感觉不太合适——它们仍然专注于文件。 Mesa将重点放在整个工作流程上：你的代理、终端、浏览器和文件都作为平等的节点存在于一个画布上，并支持完整的多人协作。（可以想象成是为代码设计的Figma）我厌倦了在多个项目之间切换窗口、标签和终端的繁琐。受到TouchDesigner和Factorio的启发，我想要一种更流畅、更直观的工具。现在我每天在工作中完全用它替代Cursor。能够同时查看多个代码库，并在每个代码库上控制代理，而无需切换窗口，这让我释放了思维空间，提高了工作效率。欢迎免费试用——我很想知道你的想法！

Meta平台：游说、黑暗资金与应用商店问责法案

170 分•作者: SilverElfin•1 天前•原帖

推理工程 [pdf]

1 分•作者: miki123211•1 天前•原帖

展示HN：使用P-C-V管道重构杂乱提示的提示优化器

1 分•作者: siris950•1 天前•原帖

我开发了一个小型网络工具，旨在自动将杂乱的提示重构为结构化的提示规范。其动机很简单：大多数人编写的提示结构较差，这常常导致不稳定的人工智能响应。因此，我实现了一个提议者-批评者-验证者优化流程。提议者重构提示。批评者评估清晰度、结构和任务定义。验证者检查一致性。仲裁者检测收敛。该系统运行多个迭代，生成结构化的提示规范。完整的优化循环通常需要大约30到40秒。该工具还包括： • 提示质量分析 • 解释模式 • 版本历史 • 提示差异查看器演示： <a href="https://how-to-grab-me.vercel.app/" rel="nofollow">https://how-to-grab-me.vercel.app/</a>希望听到使用AI工具的人是否觉得这样的工具有用。

WritBase – 开源任务管理系统，适用于人工智能代理队伍（MCP原生）

1 分•作者: RusDyn•1 天前•原帖

对iOS和iPadOS上App Store中国区店面的调整

1 分•作者: surprisetalk•1 天前•原帖