返回首页
24小时热榜
大家好,我们是Willy和Dan,Twill.ai的联合创始人(网址:<a href="https://twill.ai">https://twill.ai</a>)。Twill在隔离的云沙箱中运行像Claude Code和Codex这样的编码命令行工具。你可以通过Slack、GitHub、Linear、我们的网页应用或命令行界面提交任务,Twill会返回一个PR、审查、诊断或后续问题。当需要你的输入时,它会通知你,这样你始终可以保持控制。
<p>演示视频:<a href="https://www.youtube.com/watch?v=oyfTMXVECbs" rel="nofollow">https://www.youtube.com/watch?v=oyfTMXVECbs</a></p>
在创建Twill之前,我们在本地使用Claude Code时遇到了三个障碍:
<p>1. 并行化:两个任务如果都涉及到你的Docker配置或相同的基础设施文件,在本地同时运行会非常痛苦,手动端口重绑定和独立构建上下文无法扩展到多个任务。</p>
<p>2. 持久性:关闭笔记本电脑后,代理就停止了。我们希望在睡觉前启动一批任务,早上醒来时能看到PR。</p>
<p>3. 信任:将完全访问权限授予一个自主代理到你的本地文件系统和进程是一种冒险,而每个任务使用一个沙箱感觉更安全,可以无人值守地运行。</p>
这三点都指向了同一个答案:将代理移到云端,为每个任务提供独立的环境。
因此,我们构建了我们想要的东西。第一个版本是纯粹的委托:描述一个任务,得到一个PR。然后是多用户模式,让整个团队可以与同一个代理进行对话,每个人都在自己的线程中。接着是记忆功能,这样“使用lib/log.ts中的现有记录器,绝不要使用console.log”就成为每个未来任务的固定指令。然后是自动化:为定期工作设置定时任务,为诸如CI故障等事件触发器。
这个领域竞争激烈。AI实验室推出自己的编码产品(Claude Code、Codex),本地IDE将模型封装在你的编辑器中,还有一波初创公司在定制的框架上构建云代理。我们选择的路径是:在云沙箱中重用实验室原生的命令行工具。实验室将继续将强化学习注入他们自己的框架,因此随着时间的推移,它们只会变得更好。这样就避免了供应商锁定,你可以为每个任务选择不同的命令行工具,或将它们结合使用。
当你给Twill一个任务时,它会启动一个专用的沙箱,克隆你的代码库,安装依赖,并调用你选择的命令行工具。每个任务都有自己的文件系统、端口和进程隔离。机密信息通过环境变量在运行时注入。任务完成后,Twill会快照沙箱文件系统,以便下次在同一代码库上运行时可以快速启动,依赖项已经安装。我们选择这种架构是因为每次实验室对其编码框架进行改进时,Twill会自动获取这些改进。
我们还将开源agentbox-sdk,<a href="https://github.com/TwillAI/agentbox-sdk" rel="nofollow">https://github.com/TwillAI/agentbox-sdk</a>,这是一个用于在不同沙箱提供商之间运行和交互代理命令行工具的SDK。
以下是一个例子:一个三人团队将Twill分配给一个Linear待办事项,任务是为他们的Rails应用添加CSV导入功能。Twill克隆了代码库,设置了开发环境,实现了功能,运行了测试套件,拍摄了屏幕截图并将其附加到PR上。PR需要进行一次修订,他们通过GitHub提出了请求。对于更复杂的任务,Twill在编写代码之前会询问澄清问题,并记录浏览器会话视频(使用Vercel的Webreel)作为工作证明。
<p>免费套餐:每月10个积分(1个积分=1美元的AI计算成本,无附加费用),无需信用卡。付费计划从每月50美元起,提供50个积分,高级套餐支持自带密钥。开源项目可享受免费专业套餐。</p>
我们非常希望了解云编码代理如何融入你们今天的工作流程,以及如果你尝试Twill,哪些地方有效,哪些地方出现问题,还有哪些功能仍然缺失。
Eve 是一个运行在隔离的 Linux 沙箱中的 AI 代理(2 个虚拟 CPU、4GB 内存、10GB 磁盘),具备真实的文件系统、无头 Chromium、代码执行能力,以及与 1000 多个服务的连接器。<p>你只需给它一个任务,它会在后台工作,直到完成。<p>我构建这个是因为我想要 OpenClaw,但不想自托管,专注于实际的日常工作。我更倾向于将其视为一个有用的同事,而不是个人助理。<p>这里有一个简短的演示视频: <a href="https://www.loom.com/share/00d11bdbe804478e8817710f5f53ac61" rel="nofollow">https://www.loom.com/share/00d11bdbe804478e8817710f5f53ac61</a><p>主要界面是一个网页应用,你可以实时观看工作进展(代理生成、文件写入、命令行使用)。还有 iMessage 集成,这样你可以异步发起任务,放下手机,等任务完成后再收到回复。<p>在后台,有一个调度器(Claude Opus 4.6),它会将每个子任务路由到正确的特定领域模型:浏览、编码、研究和媒体生成。<p>对于复杂任务,它会启动并行的子代理,通过共享文件系统进行协调。它们在会话之间具有持久的记忆,因此上下文会随着时间的推移而累积。<p>我已经将其打包了许多预安装的技能,使其能够在运行时执行多种工作角色(销售、市场营销、财务)。<p>以下是 Eve 在过去几天帮助我完成的一些事情:<p>- 编辑这个带有 Garry 旁白的演示视频: <a href="https://www.youtube.com/watch?v=S4oD7H3cAQ0" rel="nofollow">https://www.youtube.com/watch?v=S4oD7H3cAQ0</a><p>- 完成我的税务申报<p>- 构建一个像 2030 年的 HN: <a href="https://api.eve.new/api/sites/hackernews-2030/#/" rel="nofollow">https://api.eve.new/api/sites/hackernews-2030/#/</a><p>欢迎就架构提问,期待你的想法 :)<p>附言:我给每位新用户提供了价值 100 美元的积分来试用。