返回首页

24小时热榜

9作者: adchurch大约 21 小时前原帖
我们构建了一个模型路由器,可以连接到编码代理(如 Claude Code、Codex、Cursor 等),并智能地将请求发送到最合适的模型进行处理。以下是本地运行的快速演示:<a href="https://www.youtube.com/watch?v=isKhAyivtfM" rel="nofollow">https://www.youtube.com/watch?v=isKhAyivtfM</a>。 在 Weave,我们几乎所有的代码都是由 AI 编写的,但这变得越来越昂贵。尤其是在 Opus 4.7 发布时,由于其分词器的变化,我们的成本急剧上升。我们知道并不需要在所有情况下都使用 Opus,但也不想在真正需要智能的场景中失去它。因此,我们决定构建一个模型路由器来处理这个问题。 Weave 路由器充当了专门为编码代理设计的 Anthropic/OpenAI 端点。它会查看每一个推理请求,并智能地(稍后会详细说明)决定将其发送到哪个模型,同时处理所需的所有转换。因此,它可以在可能的情况下使用更快/更便宜的模型(如 DeepSeek v4、GLM 5.2、Kimi K2.6),在必要时使用前沿模型(如 Opus 4.8 和 GPT 5.5(以及 Fable 一旦恢复))。 我们如何知道将请求路由到哪个模型?我们在数万条代理记录上训练了一个强化学习模型。当路由模型选择一个成功完成给定任务的 LLM 时,我们会给予奖励。 举个例子:如果你要求路由器规划一个复杂的变更,它(可能)会将该请求路由到 Opus 4.8。用于探索代码库以收集上下文的子代理将被路由到更合适的模型(如 DeepSeek V4 Flash)。然后,当你准备好实施计划时,它(大概率)会交给一个更快的模型(如 GLM 5.2)来执行。 在过去一个月左右的时间里,我们一直在内部使用这个路由器。与我们原本可能支付的费用相比,我们节省了 40% 的令牌费用,且在质量或速度上没有明显差异。 该路由器在 Elastic License 2.0 下可用源代码,因此你可以自行托管。如果你愿意,也可以使用我们的托管版本:weaverouter.com。 如果你有任何问题,我会在这里为你解答!
7作者: dnhkng大约 20 小时前原帖
你好,作者在这里!<p>我一直想为另一个即将到来的项目拼凑一个“真正的”量子随机数生成器,结果有些过于投入,走上了“过度工程”的道路。因此,为了满足你的好奇心,我将这一切进行了详细记录,并为量子力学辩论中的“多重世界解释”追随者们添加了一些有趣的内容。<p>这个量子随机数生成器使用了“性感的比特”:每个比特是一个光子在撞击50:50光束分离器后选择向左或向右的决策。这是一种标准设备,你将光源衰减到单个光子,提供一个半镜子让它们反弹,并观察它们击中的光电倍增管(或者我们最终进入了哪个宇宙;))。基本上,穿过 → 比特=0。反弹 → 比特=1。<p>由于我采用了量子力学的多重世界解释(这是更有趣的选择),我还制作了一个量子魔法八球。问它一个问题,你将得到一个确切的答案,以及跨越多重宇宙的所有可能答案。<p><a href="https:&#x2F;&#x2F;quantumlever.stream&#x2F;oracle" rel="nofollow">https:&#x2F;&#x2F;quantumlever.stream&#x2F;oracle</a><p>享受吧!