我正在使用Conductor,总体来说,它极大地提升了我的工作效率。唯一的问题是他们的“Spotlight”功能,本应将工作树与根目录同步,从而使本地测试成为可能,但它的可靠性不高。即使它能正常工作,也不完全符合我的需求,因为我希望每个工作流能够独立进行测试。
到目前为止,我尝试了三种方法,但都效果不佳:
1. 我使用了一个Conductor设置脚本,在每个工作树中运行我的本地开发环境。这并没有成功,因为Docker容器之间存在端口冲突。
2. 我使用Terraform,因此为每个PR快速启动一个资源较少的临时环境是小事一桩。这使得Conductor中的每个Claude会话都可以使用Playwright来测试代码。但有两个问题:首先,这样的成本相当高(每个PR每天$2-5)。我每天提交20-30个PR,即使有自动清理,这也让我每月花费$XXX。其次,我的部署大约需要10-15分钟,虽然时间不算长,但Claude经常需要重新提示才能检查已部署的更改。
3. 对于新功能,我只是让Claude在功能标志后将代码直接推送到暂存或生产环境。这导致了回归问题,并且需要Claude访问特权数据进行测试,因此这不是一个好的解决方案。
我在考虑是否可以使用与每个工作树关联的本地虚拟机,但在深入研究之前,我想确认一下是否有现成的解决方案我没有意识到。
返回首页
一周热榜
我已经在这个项目上工作了几个月,自从美国对伊朗采取行动的那天起。最开始它只是一个简单的开放源代码冲突监测工具,当时类似的工具层出不穷,但后来发展成一个完全不受领域限制的管道,能够提取主张和证据,综合事件,并将其映射到时间线上。它还能够归属参与者,关联事件,并提供分析。
在这个系统背后有很多功能,我还不确定该如何使用——各种上下文分析,一个讲故事的模式,可以自动带你飞越一系列事件并进行配音,还有一个系统可以进行预测并随后进行评分。
此外,还有一个完整的“新闻编辑室”层面,负责根据事态发展撰写和发布文章,使用自己的判断。
目前在deepseek-3.2上运行(在这个价格点上表现惊人),但往往会拒绝中国军事新闻。美国的模型通常会拒绝关于伊朗-以色列的内容。
在构建这个系统的过程中,我感到非常有趣,并且对时事有了很好的了解。这种工具对HN用户会有用吗?
只是一个观察。当被要求总结文章或提取见解时,我注意到Claude使用“prior”这个词的频率明显高于一般英语写作(新闻写作的本质)。而且它显然是在以贝叶斯的意义使用这个词,因为它总是提到“更新先验”、“先验不成立”等等。
这可能是我在阅读“哥布林”和“小妖精”这篇文章后注意到的。
我现在使用的是Plus级别的计划,最近对使用限制的调整真的很让人感到局限——只剩下两个任务和5小时的限制。虽然我理解Plus计划是为了让用户在一周内分散使用,但这种限制很快就会让人感到沮丧。
有没有什么建议可以通过减少消耗的令牌来延长会话时间?我已经清理了AGENTS.md文件,但似乎没有什么效果。