1作者: koolala大约 1 个月前原帖
有很多新注册的账户假装成真人到处评论。他们发布的小段落评论并没有实际表达任何观点,只是在重申显而易见的内容。<p>有人在用OpenClaw针对HN吗?我希望他们至少能使用一个高水平的模型,但看起来他们使用的是廉价的API。
1作者: kimjune01大约 1 个月前原帖
每个聊天机器人处理上下文溢出的方法都是一样的——将所有内容总结成一个块,并丢弃来源。我用一个并查集森林替代了这种方法:消息合并成簇,每个簇都有自己的摘要,你可以追溯任何摘要到产生它的消息。 我进行了七次与传统扁平摘要的对比试验。在每次试验中,并查集在事实回忆上领先15-18个百分点。其中一次达到了显著性(p=0.039),其余的结果则呈现出方向性。一个有趣的发现是:扁平摘要会遗漏“脚注”事实(如cron调度、webhook路径),因为这些信息在空间上与主要事实竞争。而每个簇的摘要则没有这种压力。 代码和试验日志请见: [https://github.com/kimjune01/union-find-compaction](https://github.com/kimjune01/union-find-compaction)