8作者: archagon10 天前原帖
我发布了 https://news.ycombinator.com/item?id=43647126,但链接一发布就显示为[无效]。我确信没有人有时间去标记它:我一点击提交,页面刷新后帖子就已经无效了。这是为什么呢?这是某种争议话题检测器还是来源过滤器吗?
3作者: cat-whisperer10 天前原帖
我创建了 WayPoint,以简化我的终端工作流程,并简化命令行命令扩展和网址缩短。以下是简要概述: <p>- 命令行命令缩短</p> <pre><code> - 输入一个快捷方式,例如 s/g 的时候,它会立即在终端中扩展为 git status。 - 通过自定义补全脚本集成支持 zsh 和 fish,能够进行就地扩展。 - 使用 YAML 文件轻松配置快捷方式,例如: </code></pre> <p>- 分层网址缩短器</p> <pre><code> - 使用相同的 YAML 配置为内部工具、文档或其他资源创建嵌套的网址快捷方式。 - 支持多级映射,并且可以实时更新,无需重启。 </code></pre> 快来试试,并分享你的反馈!
10作者: vectify_AI10 天前原帖
传统的基于向量的检索增强生成(RAG)常常在检索准确性上遇到困难,因为它优化的是相似性,而非相关性。然而,在检索中我们真正需要的是相关性,这需要推理。当处理需要领域专业知识和多步推理的专业文档时,基于向量的RAG和相似性搜索往往表现不佳。 因此,我们开始探索一种更以推理为驱动的RAG方法。基于推理的RAG使大型语言模型(LLMs)能够思考并推理出最相关的文档部分。受到AlphaGo的启发,我们提出使用树搜索来进行结构化文档检索。 我们开源了一个关键组件:PageIndex。PageIndex是一个层次索引系统,它从长文档(如财务报告、法规文件或教科书)构建搜索树结构,使其适合于基于推理的RAG。 一些亮点包括: - 层次结构:将冗长的PDF文档组织成适合LLM的树状结构——就像一个智能的目录。 - 精确引用:每个节点包含摘要和确切的物理页码。 - 自然分段:节点与文档部分对齐,保留上下文——没有任意的分块。 我们已经在财务文档分析中使用PageIndex结合基于推理的RAG,并且与基于向量的系统相比,检索准确性有了显著提高。 非常欢迎任何反馈——特别是关于基于推理的RAG的想法,或者PageIndex可以应用的地方的建议!