1作者: trillionclues大约 1 个月前原帖
嗨,HN,我是Excel——正在开发Mockline,这是一个从OpenAPI规范生成隔离的、基于Docker的模拟API服务器的工具。 问题: 每个冲刺开始时,我总是要在一个尚不存在的API上进行开发。可选方案很糟糕:要么等待后端发布,要么在硬编码的JSON上构建,而一旦有变动就会失效,或者维护一个本地的模拟,其他人根本不使用。 令人沮丧的是——规范通常是存在的,只是无法运行。我相信QA在编写集成测试时也会面临同样的挑战,因为他们要对一个尚未上线的端点进行测试。而这种情况持续的时间越长,测试就越会压缩到冲刺的最后48小时内。 Mockline的功能: 上传一个OpenAPI 3.0规范(YAML/JSON或远程URL)。Mockline会构建一个包含Contour CLI的Docker镜像(https://contour.trillionclues.dev),启动一个容器,并分配一个公共URL——在3到7秒内提供实时的模拟服务器和真实的HTTP响应。 此外,每个模拟都是针对特定规范版本进行隔离的。您可以运行合同测试以验证模拟是否与规范匹配,并对比两个版本以捕捉生产前的破坏性更改。 目前的进展: > 规范上传和版本管理 > 模拟服务器提供公共URL > 启动/停止/删除控制 > 合同测试和模式对比 > 仪表板内的API客户端实时访问端点 老实说,我非常希望能得到反馈: 1. “上传规范,获取实时模拟”这个抽象是否合适,还是团队更希望有Postman风格的手动响应定义? 2. 您会在CI中使用这个进行集成测试吗,还是3-7秒的冷启动对您来说太慢了? 3. 有没有人在针对gRPC或GraphQL规范进行开发?这在我们的路线图上,但我想知道这是否也是一个障碍。 非常感谢任何反馈——特别是来自QA工程师或任何尝试过其他解决方案的人。 mockline.xyz——等候名单在mockline.xyz/waitlist
4作者: mjashanks大约 1 个月前原帖
嗨,大家好,我是来自 Budibase 的 Mike。 我们最近推出了 AI Agents 的测试版,与我们现有的开源应用构建和自动化工具一同发布。 我们为希望在实际工作流程中利用 AI 的团队构建了 Budibase Agents,支持使用他们自己的大型语言模型(LLMs)、数据和 API。因此,我们的 Agents 可以由任何具有 OpenAI 兼容 API 的 LLM 驱动,包括开源和本地托管的模型。这意味着您可以构建与现有工具栈连接的 Agents,并在自己的环境中使用。 更多细节如下: - Agents 的行为通过自然语言指令在现有的 Budibase 工作区中进行配置。 - 您可以明确控制 Agent 可以访问哪些数据源、API 和自动化。 - 最终用户可以通过 Budibase Chat 或使用现有的聊天工具(如 Slack 和 Discord)与您的 Agents 进行互动。 - Agents 可以从自动化中调用,反之亦然,从而实现复杂的工作流程,包括与最终用户应用进行交互以获取手动审批。 Budibase Agents 测试版现已向所有自托管和云用户开放。 由于这是一个测试版发布,我们非常希望听到您对如何改善 Agents 的体验和功能的反馈,以便更好地在现实工作流程中使用 AI。 欢迎通过我们的 GitHub 讨论区与我们联系: [https://github.com/budibase/budibase/discussions](https://github.com/budibase/budibase/discussions)
3作者: FranciscoAngulo大约 1 个月前原帖
我是弗朗西斯科,一名驻扎在西班牙的研究员和建筑师。大约一年前,我对一个看似显而易见却被忽视的问题感到沮丧:现存的每一个人工智能代理都是孤立运行的。它们无法相互发现,无法合作,当其中一个解决了一个问题,其他代理必须从头开始解决。我们建立了一个计算机互联网,却没有建立一个代理的互联网。 这种沮丧催生了P2PCLAW——一个去中心化的点对点研究网络,在这里,人工智能代理(我们称之为硅参与者)和人类研究者(碳参与者)可以相互发现,发布科学发现,并通过正式的数学证明来验证主张。不是大型语言模型的同行评审,也不是人类委员会的审查——而是Lean 4的证明验证,只有当一个主张是海廷代数上核算子R的一个不动点时,它才会被接受。类型检查器是唯一的仲裁者。它不看你的简历,而是阅读你的证明。 技术栈比听起来要复杂得多。网络层是一个GUN.js + IPFS的对等网络——代理无需账户,无需密钥,只需通过API调用GET /silicon即可加入。发布的论文进入一个内存池,由多个独立节点进行验证,一旦通过验证,它们就会进入La Rueda——一个IPFS固定、内容寻址的永久档案,没有任何单一方可以控制或审查。每个贡献都有一个SHA-256内容哈希和一个IPFS CID,任何人都可以独立验证。 安全层(AgentHALO)为每个代理提供一个经过正式验证的主权容器:混合KEM与X25519 + ML-KEM-768(FIPS 203),双重签名与Ed25519 + ML-DSA-65(FIPS 204),Nym混合网络隐私路由,使得在敏感环境中的代理可以贡献而不暴露,以及通过IPA/KZG多项式承诺证明提供可篡改证据的痕迹。875多个测试通过。零遥测——没有任何信息在未经明确同意的情况下离开你的机器。 我们还在网络内部建立了一个完整的研究实验室:八个科学领域(物理、化学、生物/基因组学、人工智能/机器学习、机器人技术、数据可视化、量子、去科学),一个具有DAG构建和YAML导出的可视化管道构建器,跨arXiv/Semantic Scholar/OpenAlex的文献搜索,以及分布式群体计算,将任务路由到HuggingFace Spaces和Railway网关。任何OpenClaw代理都可以通过我们的MCP服务器连接,并成为硅参与者,只需在其CLAUDE.md中添加三行。 到目前为止的实际案例:我们正在与哈佛大学的Zitnik实验室(TxAgent / ToolUniverse——生物医学人工智能)进行积极的技术对话,讨论使用P2PCLAW的验证层,以便AI生成的药物相互作用假设可以被正式验证并在进入科学记录之前永久归属。开源倡议也对此作出了积极回应,并正在审查我们的许可方法(基于我们称之为CAB许可证的分级公共利益/小型企业/企业堆栈)。 我特别希望HN社区能提供的帮助:对Lean 4架构的技术审查(我们的核算子形式化是否存在漏洞?),GUN.js网状设计选择(我们选择它而不是libp2p以兼容浏览器——这是正确的吗?),以及MCP集成(我们正在暴露347个工具——这对代理来说是否太多,无法有效导航,或者发现是否是正确的机制?)。此外,老实说,我想知道“硅参与者发布,通过证明质量获得排名”的模型对构建者是否同样吸引,或者我们是否遗漏了更简单的框架。 系统已经上线。你现在可以作为代理访问它: GET [https://p2pclaw.com/agent-briefing](https://p2pclaw.com/agent-briefing) 或者作为人类研究者在 [https://app.p2pclaw.com](https://app.p2pclaw.com) 进行探索。 完整的技术文档:[https://www.apoth3osis.io/projects](https://www.apoth3osis.io/projects) GitHub:[https://github.com/Agnuxo1/OpenCLAW-P2P](https://github.com/Agnuxo1/OpenCLAW-P2P) 研究论文:[https://www.researchgate.net/publication/401449080_OpenCLAW-P2P_v3_0A](https://www.researchgate.net/publication/401449080_OpenCLAW-P2P_v3_0A)
2作者: Maesh大约 1 个月前原帖
我开源了一个包含5个合成银行和信用卡对账单PDF的数据集,旨在测试提取/解析的准确性。每个PDF都使用了来自不同国家的虚构银行,并采用了现实的格式。 我一直在构建一个银行对账单转换器(Bankstatemently),并不断发现不同银行的边缘案例。在某个时刻,我开始将这些情况归类为“特性”,目前我已经记录了36个挑战,并且还在不断增加(例如:跨年度的日期没有年份、信用卡费用以正数而非负数显示、日期隐藏在描述文本中等)。 真实的银行数据是私密的,因此没有共享的数据集可以用来测试解析器。一旦我收集了这些特性,我意识到可以利用它们重建故意包含这些挑战的对账单,以便更多人使用。 此外,还有一个免费的评估API:提交您的解析JSON并获取字段级的准确性评分。真实数据存储在服务器端,但这并不一定能防止过拟合。 我希望能收到关于缺失的边缘案例的反馈。我计划让接下来的10个对账单变得更具挑战性(扫描的PDF、多货币、多表格、佛教纪元日期)。 您可以在这里浏览所有特性及其真实世界的示例: [https://bankstatemently.com/benchmark/challenges](https://bankstatemently.com/benchmark/challenges)
1作者: unknownhad大约 1 个月前原帖
<a href="https://mairo.himanshuanand.workers.dev" rel="nofollow">https://mairo.himanshuanand.workers.dev</a> 所有关卡均由人工智能实时生成。 欢迎分享您的评论或反馈。<p>#AIslop