嗨,HN!我是Tony,Inngest的联合创始人。我想分享一下我们的AgentKit,这是我们开发并与一些早期用户在生产环境中测试了数月的Typescript多代理库。
尽管自OpenAI推出其Agents SDK以来,我们认为一个代理框架应该提供更确定性和灵活性的路由,能够与多个模型提供商合作,支持MCP(以便丰富工具使用),并通过使TypeScript AI开发者社区的过渡到生产用例变得顺畅,支持这个不断增长且势不可挡的社区。
这就是我们构建AgentKit的原因,我们对此感到非常兴奋,原因有几个:
首先,它很简单。我们采用了Anthropic和HuggingFace提出的KISS原则,允许你通过使用基本组件逐步增加你的AgentKit程序的自主性:
- 代理:可以与提示、工具和MCP原生支持结合的LLM调用。
- 网络:一种简单的方式,让代理通过共享状态进行合作,包括交接。
- 状态:结合了对话历史和完全类型化的状态机,用于路由。
- 路由器:自主性所在的地方,从基于代码到基于LLM的(例如:ReAct)编排。
路由器是魔法发生的地方,它允许你构建确定性的、可靠的、可测试的代理。
AgentKit的路由工作如下:网络在循环中调用自身,检查状态以确定使用路由器接下来调用哪些代理。返回的代理运行,然后可选地使用其工具更新状态数据。在下一个循环中,网络检查状态数据和对话历史,确定运行哪个新代理。
这种完全类型化的状态机路由允许你使用任何有效的代理模式确定性地构建代理——这意味着你的代码易于阅读、编辑、理解和调试。
这也使得交接变得非常容易:你使用常规代码和状态定义代理应何时相互交接(或通过在路由器中调用LLM进行基于AI的路由)。这与OpenAI Agents SDK类似,但更易于管理、规划和构建。
然后是本地开发和转移到生产的能力。
AgentKit与Inngest的工具兼容,意味着你可以使用Inngest的本地DevServer测试代理,它提供跟踪、输入、输出、重放、工具和MCP输入输出,以及(很快)一个逐步调试器,使你能够轻松理解并直观地看到代理循环中发生的事情。
在生产中,你还可以选择将AgentKit与Inngest结合使用,以实现容错执行。每个代理的LLM调用都包装在一个步骤中,工具可以使用多个步骤来包含诸如人工干预之类的事物。这为你提供了原生的编排、可观察性和开箱即用的规模。
你会发现文档作为一个AgentKit SWE-bench的示例和多个编码代理示例。
它是完全开源的,采用Apache 2许可证。
如果你想开始:
- npm: npm i @inngest/agent-kit
- GitHub: https://github.com/inngest/agent-kit
- 文档: https://agentkit.inngest.com/overview
我们很高兴最终推出AgentKit;让我们知道你的想法!
返回首页
最新
嗨,HN!我们很高兴能分享我们在Hyperbrowser上开发的MCP服务器——这是我们几天来努力工作的成果。我们认为这是一个很不错的方式,可以将大型语言模型(LLMs)和像Cursor和Windsurf这样的集成开发环境(IDEs)连接到互联网。
我们的MCP服务器提供了七个用于数据收集和浏览的工具:
1. `scrape_webpage` - 从任何网页提取格式化的内容(如Markdown、截图等)
2. `crawl_webpages` - 在多个链接页面之间导航,并提取适合LLM的格式化内容
3. `extract_structured_data` - 将杂乱的HTML转换为结构化的JSON
4. `search_with_bing` - 使用Bing搜索查询网络并获取结果
5. `browser_use_agent` - 使用浏览器代理进行快速、轻量级的浏览器自动化
6. `openai_computer_use_agent` - 使用OpenAI的CUA模型进行通用自动化
7. `claude_computer_use_agent` - 使用Claude进行复杂的浏览器任务
您可以通过命令 `npx -y hyperbrowser-mcp` 和一个Hyperbrowser API密钥将服务器连接到Cursor、Windsurf、Claude桌面以及其他任何MCP客户端。我们在过去几个月中开发的云浏览器基础设施上运行此服务——它可以自动处理验证码、代理和隐身浏览。
您可以用它做一些有趣的事情:(1)使用Claude桌面进行深入研究,(2)总结最新的HN帖子,(3)从Cursor中的简短代码片段创建完整的应用程序,(4)在Cursor中自动化代码审查,(5)使用Windsurf为任何网站生成llms.txt,(6)从Windsurf订购寿司(老实说,这只是为了好玩——我可能不会真的去做)。
我们在公开的环境中构建这个服务器,欢迎任何正在构建代理或从事网页自动化的人提供反馈。如果您发现错误或有功能请求,请告诉我们!MCP的一大问题是安装用户体验糟糕,认证凭据必须硬编码。我们目前没有解决方案,但Anthropic似乎在这方面正在努力,所以我们对此感到兴奋。我们也很想听听您对服务器本身、Hyperbrowser或安装体验的任何其他抱怨或想法。
您可以访问我们的网站 <a href="https://hyperbrowser.ai">https://hyperbrowser.ai</a>,或查看源代码 <a href="https://github.com/hyperbrowserai/mcp" rel="nofollow">https://github.com/hyperbrowserai/mcp</a>。
嘿,HN!在看到OpenAI推出他们的新计算机使用代理后,我想快速整理一下这个内容。我们很兴奋能够开始使用它,但很快意识到实际上要启动一个虚拟机(VM)并让模型执行任务,仍然需要做相当多的设置。因此,我们想要提供一种简单的方式,以软件开发工具包(SDK)的格式部署这些OpenAI计算机使用的虚拟机,并将其开源。
希望这些工具对其他构建AI代理的人有所帮助!这里是仓库链接(<a href="https://github.com/aditya-nadkarni/spongecake" rel="nofollow">https://github.com/aditya-nadkarni/spongecake</a>)- 请尝试使用,并给我们一个星标。如果你有任何反馈,请在这篇帖子中添加评论!或者,如果你简单地就是喜欢海绵蛋糕,也请为这美味的点心表示支持。
上周我把我的2020款MacBook Pro(完美运行状态)拿到苹果店里去换电池——报价249美元加税。他们把它送到了他们的服务中心,然后说它无法开机,归咎于逻辑板故障,并将价格提高到了698美元加税。在我送修时它还运行得很好。
我已经尽力升级处理这个问题,但没有任何用处。昨天我未修好的拿了回来,现在它完全死机了。在苹果动手之前它还能正常工作,我不知道该怎么办,这篇帖子是用我的手机发的。
有人处理过这种情况吗?有什么办法可以让它再次工作吗?
NeKernel 是一个用 C++ 编写的模块化操作系统内核,特色是拥有自定义文件系统和 ATA PIO 支持。<p>目前仍在开发中,欢迎提供反馈!
蒙提霍尔问题的一个变种(这个测验中的第七个问题)几个月前有点小火。至少对我来说,我可能能够理解原问题的推理过程,并且可能能够说服自己这是正确的,但是很难建立一种真正稳固的直觉来理解为什么它是正确的。
因此,我认为通过以尽可能多的方式扭曲原问题来挑战我的理解和直觉,会是一个有趣的尝试。试试看吧!