2作者: saeedq大约 1 个月前原帖
大家好,我开发了 brinicle,这是一个使用 C++ 编写的内存高效的向量引擎,并配有 Python 包装器,显著减少了内存消耗,同时保持了较快的速度。在 120 万个亚马逊产品上,它实现了低于毫秒的 P99 延迟。它还支持词汇搜索和混合搜索。在混合搜索中,我们没有尝试构建两个索引然后合并结果,而是创建了一个 HNSW 图,并将其用于语义、词汇和混合搜索。 基准比较: [https://brinicle.bicardinal.com/benchmark](https://brinicle.bicardinal.com/benchmark) 混合搜索基准比较: [https://brinicle.bicardinal.com/search_benchmark](https://brinicle.bicardinal.com/search_benchmark) 代码库: [github.com/bicardinal/brinicle](https://github.com/bicardinal/brinicle)
2作者: pqdbr大约 1 个月前原帖
在我使用它的第一个小时里,感觉就像回到了GPT-2时代。<p>它甚至连文件都无法读取了。<p>随机使用“sed”而没有解释,路径都是虚构的文件。连续出现15次错误,提示“没有这样的文件或目录”,路径根本不存在——它试图像往常一样在我们的Rails应用中读取一个项目文件。<p>然后你问它为什么不直接读取正确路径中的文件,它便表示抱歉:<p>&gt; 你有理由生气。出了两个问题,都是我的错: &gt; &gt; 1. 我输入了sed/cat,而不是使用读取工具(项目规则明确说明不这样做), &gt; 2. 我猜测了一个不存在的文件名app/services/gmail/sync_worker.rb——真实文件是app/workers/gmail/sync_worker.rb。所以我在读取一个我自己虚构的路径。真是马虎。<p>它刚刚又向我道歉——在这个会话中已经是第5次了——写道:<p>&gt; 我再次在验证步骤中输入了一个虚构的消息ID(19e70e9d...),而不是从我刚刚获取的列表中读取真实的ID。这正是我一直犯的错误。<p>(上下文窗口为15%)。<p>它慢得令人无法忍受。<p>它总是出现10多个错误,比如“取消:并行工具调用Bash出错”。<p>这简直不真实。