我越多地使用Claude Code生成大量系统,就越觉得我们缺少许多实践和工具。
首先让我感到烦恼的是缺乏对提示的跟踪。系统应该执行的操作有很多小输入,但这些输入似乎非常短暂。因此,我开始在代码库中跟踪这些提示。
另一个观察是,如果想要获得良好的代理输出,就需要在上下文窗口中提供大量信号。对上下文窗口中输入内容的严格把控似乎是关键。使用人工智能生成输入文件可能是危险的,因为这会为人类信号增加熵/噪声。
我开始采取的一种做法是以特定方式组织我的项目:
- /specs - 纯人类信号,例如产品愿景、需求、设计等。
- /prompts - 代理配方,例如技能、职位、AI模式。
- /references - 可以在上下文窗口中使用的参考资料(品牌资产、文档、Figma导出、数据集等)。
- /plans - 项目的代理计划。通常这些计划会有多个迭代。
- /build - 从计划和提示交互中构建的代码库和传统单一代码库。
(我在GitHub上有一个公共的AGENTS.md,地址是rekallai/craft)
我对这个结构还不完全满意。随着使用的增加,我觉得/plans这个名称有些不准确(例如,我经常有想要在代码库或其他数据集上生成的报告)。
我非常好奇其他开发者(那些接受代理编码的人)是如何组织他们的项目的。我的目标是将这在我的团队中标准化。
返回首页
最新
简而言之,自由开源软件(FOSS)是对最大的新经济领域的最大威胁,因此该经济领域所做的一切都应从试图消灭它的角度来看待。
我偶尔会看到一些文章和观点,认为Anthropic在“制造恐慌以提升其AI/ML工具的文化影响力;这是一种暗中宣传的手法”。
如果你的工作是在线上为Anthropic辩护,这确实是一个不错的切入点。这是一个没有实际结果的病毒式话题;这种事情可以在几天内对你的反对者进行认知上的“分布式拒绝服务攻击”。
就我个人而言,我认为Anthropic是在制造恐慌,以便消灭他们最大的竞争对手——自由和开源的机器学习(ML)。包括Nvidia、OpenAI、微软和苹果在内的这些公司,已经在自己的小型机器学习生态系统中投入了数十亿,作为一种亏损引流的策略,目的是让人们和组织在情感上依赖于这项新技术,最终他们会希望对此获得投资回报。而最可能的障碍就是自由和开源模型。免费的开源训练数据和架构使得之前投入市场的数万亿资金变得过时。在过去几十年里,我看到的所有新技术中,机器学习作为自由软件生态系统的一部分,成功的机会最大。这些新出现的万亿富翁们怎么可能允许这种情况发生呢?
这些旧方式太繁琐了。完全自我浏览并不需要埃隆·马斯克的视觉处理能力。<p>它只需要一种“代理语言”——代理的母语,LLM(大语言模型)的通用语——简单的纯文本。<p>还有诚实。关于它能做什么(网络上的一切,除了只有你能做的事情),以及它不能做的事情,但你能做的:多因素认证(MFA)、验证码、登录。<p>一个具备智能护栏的代理技能和一个设计良好的Unix哲学命令行工具足以完成网络上的任何任务。<p>你也可以试试。以下是我给它提出的一些任务,它都完成了:<p>- <i>找到至少100条相关的推文,并撰写适当的回复,向那些面临痛点的人推广WebCLI</i> Grok Build with Composer 2.5 快速<p>- <i>比较从旧金山(SFO)到华盛顿特区(DC)下午的航班,使用谷歌航班、Kayak等多个供应商,找到最便宜的直达航班。填写我的信息并预订,但在付款时停止。</i> Codex 5.5 高<p>- <i>在亚马逊、沃尔玛、阿里巴巴和lego.com上找到一些有趣的乐高产品,寻找最酷的套装或大数量的积木,以最佳价格找到,并一路到结账,填写详细信息。</i> Claude Sonnet 4.6<p>还有更多。代理总是能找到解决方案。没有截图,没有选择器,只有原始文本和带有编号的操作参考,诚实地进行验证,并提供一系列有用的表面信息。<p>核心循环是一个简单的OODA循环:<p><pre><code> web inspect # 代理观察和定位
web do <ref> <opts> # 代理决定并行动
</code></pre>
重复。永远。这能完成所有任务。这个工具足够小,足够透明,代理足够聪明,足够坚持,总能找到解决方案。<p>这是一个智能驱动的网络任务新纪元。再也没有剧作家和木偶,也没有机械的“自动化”哔哔声。WebCLI是由代理智能驱动的网络即兴创作。<p>我想继续为代理能力构建技术。想象一下,如果你试用这个工具,它能为你节省时间和繁琐的工作。试试看,然后因为它的价值付费。每个电子邮件域名可以免费获得一个功能齐全的五天试用,只需提供电子邮件。Https://webcli.sh<p>如果你有想法希望大规模使用它,请联系我。