4作者: SachitRafa大约 7 小时前原帖
这是我一直在构建的一个项目,YourMemory 是一个针对代理记忆的解决方案,专注于去除噪音而不是简单地积累数据。 在当前的代理记忆状态下,大部分上下文以 MD 文件的形式存储,或通过 RAG 模型派生,几乎存储了所有信息。这两种解决方案都会导致上下文膨胀,无法优化任何标记的使用。 在这个系统中,我们只保留相关数据,并剔除所有不必要的数据。数据的相关性通过多个因素来确定,例如回忆率、重要性、类别,以及它与哪个记忆链相连接等。这些参数经过精细调整,以便我们能够同时满足情节记忆和语义记忆的需求。 我们的记忆层以这种方式保持大小的平坦性。你可以将这个基础设施与人脑存储和修剪记忆的方式进行对比。 企业模型非常令人兴奋,因为我们可以从每个用户、代理和子代理中提取相关记忆,并且这些记忆可以被组织中的任何人使用,从而确保在企业层面上的记忆优化。
1作者: utopman大约 8 小时前原帖
大家好, 我在消费硬件上发现了这个设置,似乎在本地硬件上取得了很好的效果。 - qwen 3.6 q6 - 使用 turboquant turbo3 模式的 450K 上下文 llama.cpp 分支 - 多模态支持 这篇 AI 生成的博客文章是一种“报告”,记录了我所做的事情以及结果示例。 我希望这对一些人有所帮助。 注意:我并不太在意这篇文章的成功与否,我主要想分享我认为在 5090 上的一个有趣用法。我生成这篇博客页面时告诉 AI 遵循 hn 的“规则”,并保持事实准确。 这篇文章绝对不是完美的,写得相当快,也没有在 265K 上下文中进行适当测试,请原谅我的懒惰 :)。我现在只是对在 5090 上可以做的事情感到非常兴奋。