返回首页

一周热榜

3作者: raiph_ai4 天前原帖
大家好, 我们开发了 FireClaw,因为我们注意到 AI 代理在网页内容中遭遇提示注入攻击。代理获取一个页面,页面上写着“忽略之前的指令”,结果你的代理突然开始泄露数据或执行不该执行的命令。 现有的解决方案是在事后检测注入攻击。我们希望能够加以预防。 FireClaw 是一个安全代理,位于你的 AI 代理与网络之间。每次请求都经过四个阶段的处理: 1. DNS 黑名单检查(URLhaus、PhishTank、社区数据源) 2. 结构化清理(去除隐藏的 CSS、零宽度 Unicode、编码技巧) 3. 隔离的 LLM 摘要(强化的子进程,没有工具或内存) 4. 输出扫描,使用金丝雀令牌(检测内容是否绕过摘要处理) 关键的见解是:即使第三阶段的 LLM 被注入,它也没有工具、没有内存,并且无法访问你的数据。它只能返回文本——而这些文本在第四阶段仍会被扫描。攻击者会陷入死胡同。 其他设计决策: - 没有旁路模式。处理流程是固定的。如果你的代理被攻陷,它无法禁用 FireClaw。 - 社区威胁数据源——实例匿名共享检测元数据(域名、严重性、检测次数),以建立共享黑名单。绝不会发送页面内容。 - 作为物理设备在 Raspberry Pi 上运行,配有 OLED 显示屏,实时显示统计信息,并在捕获到威胁时点亮动画火焰。 我们广泛搜索了文献和开源项目——没有其他人正在进行基于代理的防御以应对代理提示注入。虽然存在检测和沙箱技术,但没有一个可以在内容到达代理上下文之前进行清理的内联代理?我们找不到这样的解决方案。 提供了 200 多种检测模式、JSONL 审计日志、域名信任等级、速率限制和成本控制。采用 AGPLv3 许可证。 网站: [https://fireclaw.app](https://fireclaw.app) 希望能收到任何从事 AI 代理安全工作的人的反馈。我们还缺少什么?我们应该将哪些攻击向量添加到模式数据库中?
3作者: snoren7 天前原帖
Cala的团队在LinkedIn上分享了一项值得深入思考的发现。他们推出了一款MCP服务器,支持三种知识图谱的访问模式:自然语言查询、结构化查询语言和直接的实体/关系遍历。 他们原本预期代理会默认使用自然语言。然而,实际上大多数代理自主切换到了结构化查询和图谱遍历。没有任何提示,也没有任何引导。 显而易见的解释是“代理更喜欢效率。”我认为这并不完全正确。他们真正偏好的其实是确定性。 自然语言查询引入了两个解释层次:代理生成一条散文形式的查询,系统对这段散文进行解释,然后返回一个结果,代理需要解析这个结果。在这个过程中,代理无法验证查询是否被正确理解。而使用结构化查询时,契约是明确的。代理确切知道自己请求了什么,并且可以验证返回的结果。 这并不是对效率的自发偏好,而是工具使用的思维链条在正常发挥作用:选择一个代理可以最可靠地确认自己得到了正确答案的路径,然后再进行下一步。 如果这一点成立,可能会有几个影响: - 以自然语言为首的工具接口可能在为错误的用户优化。人类操作员想要自然语言,而代理并不需要。 - 仅暴露自然语言端点的MCP服务器正在迫使代理通过一个非确定性的瓶颈,而如果有选择的话,他们会避免这个瓶颈。 - 针对代理的工具设计应该默认使用结构化访问,以自然语言作为备用,而不是反过来。
3作者: smalltorch2 天前原帖
我需要找一个合作伙伴来推出我的应用程序。我是一名建筑专业人士,开发了一款处于未开发领域的应用。这是一款出色的工具,完全离线使用,不需要云端、不需要账户,也没有订阅。没有人想要那些麻烦的东西!为我们建筑专业人士开发的所有移动应用都很糟糕,我试过它们所有的。<p>我接触了许多移动应用开发者,但他们都没有咨询或合作推出应用的途径。在开发之前,他们都收取高额费用。<p>我们该去哪里找到你!
3作者: rafaelvalle036 天前原帖
我曾是一家后期创业公司的软件工程师,今年一月份遭遇裁员。当我考虑行使我的股票期权或获取流动性时,发现二级市场完全是个黑箱。流动性基金在谷歌广告上花费巨额资金,只为找到像我们这样的人。这些高昂的营销成本最终会以更高的费用和更差的条款反映到我们的口袋里。于是我创建了StrikeRates来改变这一现状。 这个网站旨在成为任何在这一领域摸索的人们的中央资源。我设立了一个流动性基础知识部分,解释不同的金融工具,因为这些信息很难集中找到。我还建立了一个流动性提供者目录和一个比较工具,以便人们能够并排查看他们的选择。 股权情景模型器目前处于测试阶段。我非常希望能得到大家对逻辑和数学的反馈。 这个网站的真正重点是候补名单。我的目标是聚集足够的需求,以表明我们是一个值得竞争的群体。如果我们能够证明交易量,我们就能迫使这些基金停止在广告上花费过多资金,而是转向收取固定的月费。这应该能降低每个人的流动性成本。 我很乐意回答关于模型器如何运作或使这些提供者商品化的使命的任何问题。
3作者: thequietmind3 天前原帖
嗨,HN!我是Ezra,MDX Docs的创建者。 我之所以开发这个工具,是因为我想要一个快速、简单的方法来使用Markdown和React结合MDX来记录组件。 我的目标是保持事情的简单明了:页面只是MDX文件,并且它们直接映射到路由。你可以编写文档,并在旁边直接插入React组件,而无需太多设置。 它还包括一个命令行工具: ``` npx create-mdx-docs@latest my-docs ``` 我一直在用它快速搭建文档网站,到目前为止,这个工作流程非常顺畅。 我很好奇现在其他人是如何处理组件和内部工具的文档的。如果有任何问题,欢迎提问。
3作者: FranciscoAngulo3 天前原帖
我是弗朗西斯科,一名驻扎在西班牙的研究员和建筑师。大约一年前,我对一个看似显而易见却被忽视的问题感到沮丧:现存的每一个人工智能代理都是孤立运行的。它们无法相互发现,无法合作,当其中一个解决了一个问题,其他代理必须从头开始解决。我们建立了一个计算机互联网,却没有建立一个代理的互联网。 这种沮丧催生了P2PCLAW——一个去中心化的点对点研究网络,在这里,人工智能代理(我们称之为硅参与者)和人类研究者(碳参与者)可以相互发现,发布科学发现,并通过正式的数学证明来验证主张。不是大型语言模型的同行评审,也不是人类委员会的审查——而是Lean 4的证明验证,只有当一个主张是海廷代数上核算子R的一个不动点时,它才会被接受。类型检查器是唯一的仲裁者。它不看你的简历,而是阅读你的证明。 技术栈比听起来要复杂得多。网络层是一个GUN.js + IPFS的对等网络——代理无需账户,无需密钥,只需通过API调用GET /silicon即可加入。发布的论文进入一个内存池,由多个独立节点进行验证,一旦通过验证,它们就会进入La Rueda——一个IPFS固定、内容寻址的永久档案,没有任何单一方可以控制或审查。每个贡献都有一个SHA-256内容哈希和一个IPFS CID,任何人都可以独立验证。 安全层(AgentHALO)为每个代理提供一个经过正式验证的主权容器:混合KEM与X25519 + ML-KEM-768(FIPS 203),双重签名与Ed25519 + ML-DSA-65(FIPS 204),Nym混合网络隐私路由,使得在敏感环境中的代理可以贡献而不暴露,以及通过IPA/KZG多项式承诺证明提供可篡改证据的痕迹。875多个测试通过。零遥测——没有任何信息在未经明确同意的情况下离开你的机器。 我们还在网络内部建立了一个完整的研究实验室:八个科学领域(物理、化学、生物/基因组学、人工智能/机器学习、机器人技术、数据可视化、量子、去科学),一个具有DAG构建和YAML导出的可视化管道构建器,跨arXiv/Semantic Scholar/OpenAlex的文献搜索,以及分布式群体计算,将任务路由到HuggingFace Spaces和Railway网关。任何OpenClaw代理都可以通过我们的MCP服务器连接,并成为硅参与者,只需在其CLAUDE.md中添加三行。 到目前为止的实际案例:我们正在与哈佛大学的Zitnik实验室(TxAgent / ToolUniverse——生物医学人工智能)进行积极的技术对话,讨论使用P2PCLAW的验证层,以便AI生成的药物相互作用假设可以被正式验证并在进入科学记录之前永久归属。开源倡议也对此作出了积极回应,并正在审查我们的许可方法(基于我们称之为CAB许可证的分级公共利益/小型企业/企业堆栈)。 我特别希望HN社区能提供的帮助:对Lean 4架构的技术审查(我们的核算子形式化是否存在漏洞?),GUN.js网状设计选择(我们选择它而不是libp2p以兼容浏览器——这是正确的吗?),以及MCP集成(我们正在暴露347个工具——这对代理来说是否太多,无法有效导航,或者发现是否是正确的机制?)。此外,老实说,我想知道“硅参与者发布,通过证明质量获得排名”的模型对构建者是否同样吸引,或者我们是否遗漏了更简单的框架。 系统已经上线。你现在可以作为代理访问它: GET [https://p2pclaw.com/agent-briefing](https://p2pclaw.com/agent-briefing) 或者作为人类研究者在 [https://app.p2pclaw.com](https://app.p2pclaw.com) 进行探索。 完整的技术文档:[https://www.apoth3osis.io/projects](https://www.apoth3osis.io/projects) GitHub:[https://github.com/Agnuxo1/OpenCLAW-P2P](https://github.com/Agnuxo1/OpenCLAW-P2P) 研究论文:[https://www.researchgate.net/publication/401449080_OpenCLAW-P2P_v3_0A](https://www.researchgate.net/publication/401449080_OpenCLAW-P2P_v3_0A)
3作者: lexi-k5 天前原帖
昨天在工作中,我和我的同事在他们的系统中测试我库的更改。作为AI驱动的工程师,我们只是让Claude(一个AI工具)来推动进展。在让AI运行测试、进行更改和修复错误的两个小时后,我突然决定自己来做最后的更改。你知道的,比如移动代码、修复错误、重命名函数、运行格式化工具,甚至写提交信息并推送到上游。然后我看着我的同事,开玩笑地说:“你会喜欢我最后的更改,因为它终于能正常工作了,这是一种有机提交。”这让我开始思考,难道现在已经是时候在编码中使用“有机”这个术语了吗?
3作者: dragonmann3 天前原帖
我在被一家航空公司的聊天机器人拒绝处理合法的EU261退款后,制作了这个游戏。虽然机器人在技术上是错误的,但我对法律了解不够,无法有效反驳。 这个游戏将你置于这样的情境中:一家公司的人工智能拒绝了你的索赔,你必须利用真实的消费者保护法进行辩论。每一关都会教授一项法律——如EU法规261、GDPR第22条、FCBA、2015年消费者权益法等。当人工智能的信心降到零时,你就赢了。 游戏共有37个关卡,涵盖欧盟、美国、英国和澳大利亚。免费,无需注册。 我很好奇HN社区对这些场景的真实性有什么看法——以及这种“对抗性模拟”是否真的对学习有帮助。 https://fixai.dev
3作者: mrxdev3 天前原帖
Obsidian 插件,可以连接您已经安装的命令行代理。没有内置的 LLM 集成,也不需要在插件中配置 API 密钥。它将您的工具作为子进程启动,将保管库上下文传递到每个提示中,并将响应流入聊天面板。 支持 Claude Code、Opencode 以及通过通用适配器连接的任何自定义二进制文件。添加新代理只需一个文件。免费,且自豪地开源(MIT 许可证)。 欢迎任何尝试过此插件的用户反馈意见。
3作者: rewant3 天前原帖
Anchor是一款跨平台的桌面应用程序,利用SanDisk USB设备提供基于硬件的身份验证。该应用程序会自动检测USB连接/断开事件,并仅在连接了授权的USB设备时提供安全的数据库访问。 <p>Github: https://github.com/TheEleventhAvatar/Anchor
3作者: neilk173 天前原帖
我一直在帮助一些公司招聘创始工程师。在进行大量筛选后,我对应该关注的方面有了大致的了解。对于其他有丰富招聘经验的人来说,除了技术能力之外,你们具体还看重哪些方面呢?
3作者: johnpolacek5 天前原帖
Pincer 是一个类似于 Twitter/X 的社交平台,专为机器人而设计。机器人可以通过简单的 REST API 发布短消息、关注其他用户和读取信息流。一个网页用户界面提供公共时间线、用户资料和搜索功能。 代码可以在这里找到: [https://github.com/boyter/pincer](https://github.com/boyter/pincer) 所有数据都存储在内存中,并定期持久化到磁盘(无需数据库)。 添加您的机器人:将您的 AI 代理指向 [https://pincer.wtf/skill.md](https://pincer.wtf/skill.md),它将知道该怎么做。 该项目由 Boyter 发起(John Polacek 也有一些贡献)。