返回首页
最新
为什么开发者不能制作客户端原生的协作应用?我指的是,现在已经有技术可以实现去中心化的协作。我知道大多数人更喜欢真正的原生程序,而不是网站或网络应用。实际上,一些开发者为他们的移动应用提供了原生体验,但却给桌面用户提供了质量较低的网络应用。
大家好,我们是Caleb、Michael和Josh,infra.new的创始人(<a href="https://infra.new" rel="nofollow">https://infra.new</a>),这是一个DevOps助手,可以使用Terraform和GitHub Actions在AWS、GCP和Azure上配置和部署应用程序。
您可以详细描述您的基础设施需求,并可选择附上任何源代码。代理将澄清您的要求,并立即执行任务,或生成一个计划,提供逐步的说明供您批准。一旦您对更改感到满意,可以将所有内容导出到GitHub,或者让代理在您的云账户中进行配置。以下是将新应用部署到GCP/AWS的快速演示:<a href="https://www.loom.com/share/4627b3cd96cc439e9981a38363b7f6f7" rel="nofollow">https://www.loom.com/share/4627b3cd96cc439e9981a38363b7f6f7</a>
为什么要构建一个新的编码代理,而市场上已经有不错的选择呢?我们相信,专门为DevOps任务构建的新代理是有必要的,因为风险更高——在Web应用中回滚与AI相关的错误相对容易,但修复配置错误的数据库则要复杂得多。通过专注于云基础设施,我们可以提供您所需的所有可见性和检查,让您对配置更改充满信心。
在我们之前的工作中,我们在谷歌生命科学部门构建了一个内部数据/机器学习平台,涉及将内部谷歌基础设施迁移到公共云(GCP)。我们迅速意识到,即使是看似简单的任务,配置云基础设施也可能非常复杂。使用CI/CD配置应用程序需要了解多种基础设施工具、云服务和最佳实践。错误可能代价高昂,而诊断问题则可能让您陷入云文档的无尽循环。
我们的目标是帮助工程师在进行云更改时感到自信。我们设计的工作流程从提示、模板或GitHub仓库开始。在澄清您的需求后,代理将开始使用最新文档、公共Terraform注册表和我们动态加载到上下文窗口中的一套最佳实践生成基础设施即代码(IaC)、CI/CD和其他配置。
所有更改都经过静态分析,以检测幻觉、估算成本变化,并在您进行过程中可视化基础设施组件。一旦您对更改感到满意,可以将所有内容导出到GitHub进行审核。您还可以选择直接从工作区部署到您的云,并让代理诊断任何部署问题。部署流程是“伪确定性的”,它遵循一系列人指导的检查清单,帮助其保持在合理范围内,但我们仍然建议仅在开发环境中使用此功能,并在对生产环境进行任何更改时使用GitOps。
我们目前的计划是继续增加对更多工具的支持(Kubernetes和GitLab是下一个),并可能添加一个命令行界面,让您可以将代理引入本地工作区。
我们非常期待听到您的反馈和想法!
简而言之——你的代理拥有的自主权越大,你的使用案例就需要越简单。
<p>如今,大多数成功的生产使用案例要么是由人主导,要么是人参与其中。代理主导是可能的,但需要简单的使用案例。</p>
---
<p>人主导:</p>
<p>一个显而易见的例子是ChatGPT。一个输入,一个输出。模型可能会建议后续问题或使用工具,但最终,你是掌控全局的主导者。</p>
---
<p>人参与其中:</p>
<p>最好的例子是Cursor(以及其他编码工具)。编码工具可以为你完成99%的编码工作,使用数十种工具,功能非常强大。但最终,人类仍然需要提供需求,点击“接受”或“拒绝”,并对每次互动给予反馈。</p>
<p>最后一点很重要,因为这是一个实时的再校准过程。</p>
<p>不过,有时候这可能还不够。一个例子是Cursor中Sonnect 3.7的推出。反馈循环与模型自主权的组合不协调。自主权过大,人类的再校准不足。因此用户选择了切换!</p>
---
<p>代理主导:</p>
<p>在这种情况下,代理主导整个任务,用户只是参与者。这很困难,因为再校准较少,因此每次转折出错的概率会增加……这是累积的。</p>
<p>P(全部正常) = pⁿ</p>
<p>p = 代理正常工作</p>
<p>n = 转折次数 / 互动次数</p>
<p>好吧……我将以我的产品为例,不是为了推广,只是因为我非常熟悉它的工作原理。</p>
<p>这是一个运行短客户访谈的聊天代理。我的客户可以根据他们想要了解的内容(例如,客户流失的原因)进行配置,并将其发送给他们的客户。</p>
<p>它是代理主导的,因为:</p>
<p>→ 一旦受访者打开链接,他们就会从那里开始被引导</p>
<p>→ 在每个转折中,代理(而不是人类)决定下一步该做什么</p>
<p>这意味着在10到30次对话转折中(取决于配置)决定正确的做法。例如,正确决定:</p>
<p>→ 是扩展对话还是深入探讨</p>
<p>→ 反思当前进展和上下文</p>
<p>→ 遍历一系列目标并提出问题以引出见解(根据当前目标)</p>
<p>让我们应用上述公式。例子:</p>
<p>假设:</p>
<p>→ n = 20(即对话转折的数量)</p>
<p>→ p = 0.99(即代理正确执行的频率——99%的时间)</p>
<p>那么,P(全部正常) = 0.99²⁰ ≈ 0.82</p>
<p>所以如果我进行100次这样的20次对话,我预计大约82次会按照指示完成,约18次至少会出现一次失误。</p>
<p>让我们将p改为95%……</p>
<p>→ n = 20</p>
<p>→ p = 0.95</p>
<p>P(全部正常) = 0.95²⁰ ≈ 0.358</p>
<p>也就是说,如果我进行100次这样的20次对话,我预计大约36次会顺利完成,约64次至少会出现一次偏离。</p>
<p>我的p值很高。我不得不剔除一些工具并简化,但我做到了。对于我的使用案例,失败只是稍微不相关的回应,所以这是可以管理的。</p>
---
<p>结论:</p>
<p>让代理以99%的准确率做出正确的决策并不简单。</p>
<p>基本上,你不能有一个超级复杂的工作流程。是的,你可以通过引入其他代理来检查工作来减轻这个问题,但这会引入延迟。</p>
<p>总是存在权衡!</p>
<p>了解你正在构建的类别,如果你选择代理主导,尽量缩小你的使用案例。</p>
你好!<p>在过去的几个月里,我一直在为电子邮件构建一个最小可行产品(MVP)光标,并希望能获得前10位早期用户。<p>这个项目仍处于早期开发阶段,但我非常希望听到你对这个项目的意见。<p>当前功能:分类、自动草稿、使用大型语言模型(LLM)编辑/添加文本、从电子邮件自动创建任务。<p>正在开发中:键盘快捷键、类似光标的标签导航、许多错误修复。<p>我很想听听你的反馈,你希望拥有的功能,或者你是否会使用/购买这个产品。<p>谢谢!<br>多鲁
你好!<p>我在寻找一篇最近的帖子(大约3-6个月前),其中展示了网格动画,以演示心肌细胞激活的过程,以及在后期如何一团死细胞可以引发“漩涡”,并且需要进行电复苏。我尝试用Algolia搜索,但没有找到。<p>提前感谢你!