返回首页
最新
嗨,HN!我们是 Arjun、Ramnique 和 Akhilesh,Rowboat 的创始人(<a href="https://www.rowboatlabs.com">https://www.rowboatlabs.com</a>),这是一个 AI 辅助的集成开发环境(IDE),用于构建和管理多智能体系统。使用 Rowboat,您可以构建确定性自动化代理(例如,自动总结电子邮件)以及更具智能体特征的系统(例如,会议准备助手或客户支持机器人)。
以下是一些示例:
- 会议准备助手:<a href="https://www.youtube.com/watch?v=KZTP4xZM2DY" rel="nofollow">https://www.youtube.com/watch?v=KZTP4xZM2DY</a>
- 客户支持助手:<a href="https://www.youtube.com/watch?v=Xfo-OfgOl8w" rel="nofollow">https://www.youtube.com/watch?v=Xfo-OfgOl8w</a>
- Gmail 和 Reddit 助手:<a href="https://www.youtube.com/watch?v=6r7P4Vlcn2g" rel="nofollow">https://www.youtube.com/watch?v=6r7P4Vlcn2g</a>
Rowboat 是开源的(<a href="https://github.com/rowboatlabs/rowboat" rel="nofollow">https://github.com/rowboatlabs/rowboat</a>),并且拥有一个不断壮大的社区。几个月前,我们首次在 Show HN 上发布了它(<a href="https://news.ycombinator.com/item?id=43763967">https://news.ycombinator.com/item?id=43763967</a>)。
今天,我们推出了一个重大更新,并推出了云服务。我们增加了对数百种工具(如 Gmail、Github 和 Slack)的内置工具集成、与文档和 URL 的 RAG(检索增强生成)功能,以及根据外部事件触发助手的功能。
我们的云版本包含开源 IDE 的所有功能,但可以立即运行,无需设置或 API 密钥。为了庆祝发布,我们提供 $10 的免费使用额度,您可以立即开始构建,而无需输入任何信用卡信息。付费计划从每月 $20 开始,提供额外模型(OpenAI、Anthropic、Gemini,更多模型即将推出)和更高的使用限制。
越来越多的人认为某些任务更适合由单个代理处理(<a href="https://news.ycombinator.com/item?id=45096962">https://news.ycombinator.com/item?id=45096962</a>),而其他任务则可以通过多智能体系统获得更高的准确性(<a href="https://www.anthropic.com/engineering/multi-agent-research-system" rel="nofollow">https://www.anthropic.com/engineering/multi-agent-research-system</a>)。这种差异通常取决于任务的范围:像编程这样的专注任务适合单个代理,而处理电子邮件、Slack 和 LinkedIn 等多个领域的任务则更适合分配给多个代理。多智能体系统还可以避免上下文污染,因为当大型语言模型(LLM)被要求处理无关任务时会失去焦点。此外,清晰划分责任使得每个代理更容易进行测试、调试和改进。
然而,将工作拆分为多个代理并正确设置它们的提示是具有挑战性的。OpenAI 和其他公司已经发布了适用于不同场景的有效模式(<a href="https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf" rel="nofollow">https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf</a>)。我们在 OpenAI 的代理 SDK 基础上添加了代理抽象,以支持这些模式。这些包括可以在需要时决定交接给另一个代理的用户代理;执行内部任务的任务代理;以及以确定性方式调用一系列代理的管道。
Rowboat 的副驾驶(“Skipper”)了解这些模式,并已经植入了经过测试的模式,例如客户支持机器人的经理-员工设置、自动文档摘要的管道,以及将网络搜索与 RAG 结合的多智能体工作流。它可以:
- 从高层请求构建多智能体系统,并决定如何在代理之间分配工作
- 编辑代理指令,以使用 Composio 工具或任何连接的 MCP 服务器进行正确的工具调用
- 观察您的实验室聊天,并根据您的测试改进代理
我们将智能体系统视为一个光谱。在一端是具有少量 LLM 调用的确定性工作流;在另一端是完全智能的系统,其中 LLM 做出所有控制流决策——我们专注于这个光谱的这一端,同时在现实世界的助手用例中仍然允许必要的确定性控制。我们故意避免使用流程图风格的编辑器(如 n8n),因为在构建和维护高度智能的系统时,它们变得难以管理。
我们期待听到您的想法!
嗨,HN,
我一直在开发一个我很想分享的项目:47jobs([https://47jobs.com](https://47jobs.com))——一个可以雇佣AI代理来完成任务的市场,而不是人类自由职业者。
为什么会这样?
我注意到在Upwork/Fiverr上,许多任务——如编码、内容生成、数据分析、自动化——现在可以在几分钟内由AI处理,而不是几个小时。但市场上并没有一个专门用于直接雇佣AI的平台。
所以我创建了47jobs:
100%由AI代理完成工作(没有人参与)。
工作交付速度提高了10倍,价格透明。
你可以“雇佣”一个代理进行编码、自动化、研究等。
我很想听听你的想法:
一个纯AI代理的市场是否合理?
你希望AI代理首先处理哪些类型的工作?
在这个模型中,你预期会遇到哪些用户体验或信任问题?
这是一个早期版本,我希望从你的反馈中学习。
谢谢!