返回首页

24小时热榜

9作者: adchurch大约 14 小时前原帖
我们构建了一个模型路由器,可以连接到编码代理(如 Claude Code、Codex、Cursor 等),并智能地将请求发送到最合适的模型进行处理。以下是本地运行的快速演示:<a href="https://www.youtube.com/watch?v=isKhAyivtfM" rel="nofollow">https://www.youtube.com/watch?v=isKhAyivtfM</a>。 在 Weave,我们几乎所有的代码都是由 AI 编写的,但这变得越来越昂贵。尤其是在 Opus 4.7 发布时,由于其分词器的变化,我们的成本急剧上升。我们知道并不需要在所有情况下都使用 Opus,但也不想在真正需要智能的场景中失去它。因此,我们决定构建一个模型路由器来处理这个问题。 Weave 路由器充当了专门为编码代理设计的 Anthropic/OpenAI 端点。它会查看每一个推理请求,并智能地(稍后会详细说明)决定将其发送到哪个模型,同时处理所需的所有转换。因此,它可以在可能的情况下使用更快/更便宜的模型(如 DeepSeek v4、GLM 5.2、Kimi K2.6),在必要时使用前沿模型(如 Opus 4.8 和 GPT 5.5(以及 Fable 一旦恢复))。 我们如何知道将请求路由到哪个模型?我们在数万条代理记录上训练了一个强化学习模型。当路由模型选择一个成功完成给定任务的 LLM 时,我们会给予奖励。 举个例子:如果你要求路由器规划一个复杂的变更,它(可能)会将该请求路由到 Opus 4.8。用于探索代码库以收集上下文的子代理将被路由到更合适的模型(如 DeepSeek V4 Flash)。然后,当你准备好实施计划时,它(大概率)会交给一个更快的模型(如 GLM 5.2)来执行。 在过去一个月左右的时间里,我们一直在内部使用这个路由器。与我们原本可能支付的费用相比,我们节省了 40% 的令牌费用,且在质量或速度上没有明显差异。 该路由器在 Elastic License 2.0 下可用源代码,因此你可以自行托管。如果你愿意,也可以使用我们的托管版本:weaverouter.com。 如果你有任何问题,我会在这里为你解答!
7作者: dnhkng大约 13 小时前原帖
你好,作者在这里!<p>我一直想为另一个即将到来的项目拼凑一个“真正的”量子随机数生成器,结果有些过于投入,走上了“过度工程”的道路。因此,为了满足你的好奇心,我将这一切进行了详细记录,并为量子力学辩论中的“多重世界解释”追随者们添加了一些有趣的内容。<p>这个量子随机数生成器使用了“性感的比特”:每个比特是一个光子在撞击50:50光束分离器后选择向左或向右的决策。这是一种标准设备,你将光源衰减到单个光子,提供一个半镜子让它们反弹,并观察它们击中的光电倍增管(或者我们最终进入了哪个宇宙;))。基本上,穿过 → 比特=0。反弹 → 比特=1。<p>由于我采用了量子力学的多重世界解释(这是更有趣的选择),我还制作了一个量子魔法八球。问它一个问题,你将得到一个确切的答案,以及跨越多重宇宙的所有可能答案。<p><a href="https:&#x2F;&#x2F;quantumlever.stream&#x2F;oracle" rel="nofollow">https:&#x2F;&#x2F;quantumlever.stream&#x2F;oracle</a><p>享受吧!
6作者: notsure357大约 12 小时前原帖
我14岁的女儿的账户被黑客入侵,黑客成功将自己添加为她账户的“关联家长”。我甚至不确定这个人最初是如何获得她密码的。这一切发生在周三早上(6月24日),但在事件发生当天,我没有收到任何与此相关的电子邮件,尽管该账户与我的电子邮件地址(已验证)关联。通常情况下,如果有新的登录尝试来自未识别的设备,我会收到一封电子邮件,但在6月24日我没有收到任何邮件。我怀疑即使她的账户已经启用了双重身份验证,也无济于事,因为账户中添加了一个双重身份验证的密钥,这显然不是她设置的。但利用这个新创建的身份验证密钥,“关联家长”显然能够登录她的账户(我没有收到任何关于此的电子邮件),进入每个游戏,并转移她自2020年以来收集的所有可收集物品。 更令人震惊的是,Roblox表示他们对这些丢失的可收集物品不负责任。过去六年中用于购买这些可收集物品的所有圣诞节和生日Roblox礼品卡,竟然被这个“关联家长”完全抹去。我女儿对这些可收集物品的损失感到非常沮丧。 在重置密码的过程中,我不得不禁用双重身份验证才能登录账户。一旦进入账户,无法在没有密钥的情况下移除双重身份验证密钥,我还得通过一个人工智能聊天机器人来处理这个问题。“关联家长”还更改了出生日期,让我女儿在Roblox中变成了8岁,显然出于某种原因,您只能更改一次出生日期,这意味着我不得不一次又一次地请求更改出生日期。每次提交这些支持请求时,我都必须证明我是人类(验证码),输入六位数的电子邮件安全代码,然后尝试与一个只部分理解我问题的人工智能机器人对话。我可以请求与人类交谈,但这会立即结束与人工智能机器人的聊天,告诉我已经提交了支持请求。 最令人困惑的是,我曾请求移除这个“关联家长”,但无论是人工智能还是支持团队,我都无法将其移除。我甚至有一个工单被关闭,邮件回复告诉我:“由于安全原因,我们无法更新或修改您孩子账户上的家长设置。家长控制可以在与您孩子账户关联的家长权限下进行管理。”当我与人工智能机器人讨论这个问题时,他们解释说,“关联家长”是唯一可以从我孩子账户中移除自己的人员,任何超出这个答案的请求都被拒绝。我最终遇到了瓶颈,因为我提交了太多请求,他们不再接受我的表单提交。我的妻子现在正在处理这些问题,因为我已经无计可施。她能够将账户转移到她的电子邮件地址,因为她过去曾为该账户向Roblox付款,但“关联家长”仍然存在。 在经历了这一切之后,我为什么还会想再给Roblox送钱呢?孩子们在这个游戏平台上比任何人都更聪明,会不断找到漏洞来做这些事情。无论增加多少程序性限制沟通的层级,这只会让问题变得更糟,因为根本上Roblox对在一个可以在朋友之间交易或被小偷盗取的系统中丢失的物品不承担任何责任。我不知道Roblox是否能解决这些问题,因为他们的解决方案似乎实际上在让事情变得更糟。如果你在Roblox有任何股票,我会说这是一个强烈的卖出信号!
6作者: mohsen1大约 19 小时前原帖
你好!<p>这是一个尝试使 google3 风格的代码库克隆与 Git 一起工作的项目。几天前在一个 HN 讨论线程中,我得到了这个想法。<p>对于那些需要克隆以进行 AI 编程会话的大型代码库,这个功能非常有用,因为这些会话可能只需要一部分文件来完成某些任务。<p>类似于 google3,文件看起来是存在的,可以被读取和编辑,但只有在需要时才会被获取。<p>它与普通的 Git 命令兼容,因此无需新的命令行工具。<p>一个主要的问题是,运行 grep 会强制获取所有与 grep 模式匹配的文件。AI 编程会话中经常会使用 grep 工具。为了解决这个问题,git-lazy-mount 提供了 sgrep,它将 grep 操作转移到像 SourceGraph 这样的远程代码搜索引擎上。<p>通过这种方式,运行 AI 会话的微型虚拟机可以保持轻量,并且启动速度更快。<p>我猜这可能比将 git 仓库直接打包到镜像中要快,但我还没有测量过它的性能。如果微型虚拟机是基于未知的代码库启动的(类似于 Claude 在网页上的表现),这绝对是有用的。<p>期待听到你的想法和批评。<p>谢谢!