返回首页
24小时热榜
简而言之:我训练了一个分类器,用于将请求路由到最便宜的模型和推理深度。结合额外的自动化令牌效率技术,这使得在相同支出下使用量提高了三倍。对于任何想自己尝试的人:<a href="https://nerfguard.com" rel="nofollow">https://nerfguard.com</a>
最近,我和一些团队成员从Claude Code切换到了Codex。我们仍在这两种工具之间切换,但Codex的速度和可控性以及性能提升让人难以忽视。一个缺点是,按令牌计费的费用很快就开始生效。这种情况普遍存在,但我们在Codex中感受得尤为明显。我们是一家初创公司,团队成员全天候工作,热衷于构建产品——因此,我们的<i>每日</i>账单显得格外引人注目。
幸运的是,我们正在追求一个重要的使命,速度比边际令牌支出更为重要。不过,这让我们思考,尽管我们的产品在减少令牌支出和显著加快代理工作流程方面有着意想不到的效果,但我们却在所有类型的内部编码任务中使用这些顶级模型,而没有进行任何优化。这种浪费显得相当荒谬——最明显的罪魁祸首是,我们似乎在每个任务上都使用了最高智能模型和最大推理深度,即使这些任务显然并不需要如此。作为一家花费大量时间在缓存智能上的公司,我们也很容易看到还有许多其他的低悬果实可以摘取。
因此,在最近的一个周末,我迅速构建了一个工具来优化我们的使用。它的核心是一个<i>非常快速</i>的分类器,可以将请求分类到完成任务所需的最低智能水平,并在此基础上进行一些不错的令牌优化。结果是,令牌支出大幅降低,但质量大致相同。对我们来说,更令人兴奋的是,合理打包的智能和推理水平使我们的速度也显著提升。这并非微不足道。
我们观察到,每个人每天节省了高达三倍的时间,这些时间本来是用来等待工具的响应和编码代理的反馈。
对我们来说,这意味着工程效率的提升,以及在相同支出下显著更高的使用量。这也意味着在被限制之前可以使用更多的资源。
当我告诉朋友们这件事时,他们也想开始使用它,以最大化他们从编码代理计划中获得的使用量。现在,许多最前沿的人工智能公司的工程师都在使用这个工具来优化他们的令牌利用率。不仅是为了节省资金,更是为了最大化产出。事实证明,避免被Claude限制的最佳方法是有选择性地主动限制自己。我们决定将其发布给其他开发者社区使用。现在,您可以为自己启用Nerfguard,今天就开始获得更多的使用量。
这个周末是ABC经典FM的倒计时,这让我想起了一个旧的未发布的数据可视化项目,展示了往年的排名。我考虑过添加搜索功能,但我也挺喜欢它现在的形式,需要一些探索才能找到信息。部分代码有点笨重,我不介意对其进行重构。我也不太确定浏览器的兼容性——我只有几台设备可以进行测试。
我的团队每天都在使用Claude Code,这些会话已经成为我们生成的一些最有价值的成果。但它们被困在各自的笔记本电脑上的~/.claude/projects目录中。没有好的方法可以将“我理清迁移的会话”交给同事,以便他们能够使用claude --resume从我停下的地方继续。
这就是ccgs的用武之地:通过在您现有仓库的远程中创建一个孤立分支(@ccgs/<name>)来分享Claude Code会话。
- 会话文件携带作者的绝对路径。在拉取时,ccgs会将工作目录重写为您的路径,以便resume能够正常工作——仅对结构性的cwd字段进行精确编辑,而不是盲目的查找和替换,这样不会损坏记录。
- 一切都通过git底层命令(hash-object/commit-tree/update-ref)在一个临时索引上进行。它不会触碰您的工作树、索引或当前分支,并且可以处理脏树。它不会在您不知情的情况下进行git checkout。
要尝试而不安装:`npx claude-git-sessions`。这也顺便允许您移动一个目录并携带Claude Code的记录(只需先推送,然后移动目录,再拉取)。
重要警告:除非您有非常好的安全卫生习惯,否则您的Claude Code会话可能充满敏感信息,例如环境密钥。请谨慎使用,并避免在公共仓库中使用。ccgs使用的分支以`@ccgs/`为前缀,因此您可以轻松过滤掉它们。
*这个项目是由Claude Code编写的。这次Show HN不是。*
(重新发布,修正了URL)