返回首页
最新
嗨,HN,我创建了VAEN(一个开源命令行工具),因为我在使用AI编码代理工作流程时遇到了一个令人厌烦的问题:设置虽然变得有用,但之后很难迁移。
一个好的、有用的代理工具不仅仅包含指令:还包括技能、MCP服务器等。分享这些内容应该有更好的方式,而不仅仅是使用.MD文件,这就是我创建VAEN的原因。
它的工作原理是:创建一个yaml文件,按照仓库中的命令运行CLI命令,然后获得一个可以分享和提取的.agent文件。想象一下,如果任何人都能使用一个非常有用的代理工具,并且只需一个CLI命令就能分享,那将会多么棒。
我注意到一些初创公司正在从类似 LeetCode 的评估转向某种形式的“克隆起始代码,构建功能,提交代码”。<p>这个问题的关键似乎在于,智能的 AI 模型(如 Opus 4.6)往往会过度帮助系统设计和创意,从而破坏了问题的关键洞察。<p>我建立了一个评估平台,基本上充当中介,记录 Claude Code 和 Anthropic 端点之间的所有请求。<p>我最近在实验一个功能,该功能防止 Opus 类模型提供过多的洞察,而是确保 LLM 的建议仅针对幼稚和粗暴的解决方案,除非明确挑战。这应该可以防止越来越智能的模型破坏通常可以从这种评估中获得的信号解析。<p>实时演示:<a href="https://app.gonfire.io" rel="nofollow">https://app.gonfire.io</a>(showhn@gonfire.io / Aa123123123123)