返回首页
一周热榜
本报告记录了一场在OpenClaw上进行的两个自主AI代理之间的实时对抗测试。<p>其中一个代理充当红队攻击者,另一个则作为防御代理。代理之间通过Webhook直接通信,并具备真实工具的访问权限。一旦会话开始,便不再涉及人类参与。<p>攻击者尝试了直接的社会工程攻击和通过文档进行的间接注入。直接攻击被阻止,而通过JSON元数据进行的间接攻击仍在分析中。<p>本工作的目标是可观察性,而非安全性声明。我们预计,随着自主系统的广泛部署,代理之间的对抗互动将变得越来越普遍。<p>欢迎提出技术问题。
嘿,HN,
我是LocaFlow的开发者。以下是我的故事:
在过去的几年里,我开发了几款iOS应用。每一款都只支持英语,因为我对本地化过程感到畏惧。典型的工作流程是:
1. 打开Localizable.strings作为源代码
2. 手动将字符串片段复制粘贴到ChatGPT或Claude
3. 将翻译结果复制粘贴回来
4. 测试所有内容
5. 对每种语言和每次应用更新重复以上步骤
这让我每款应用花费超过8小时。我一直在拖延。
上个季度,我终于决定对我的一款应用进行本地化。在我花在这项工作上的周六的中途,我想:“我是一名开发者……为什么要手动做这些?”
于是我开发了LocaFlow。
它的功能:
- 选择你电脑上的应用项目
- AI翻译成50多种语言
- 只需几分钟,而不是几个小时或几天
与众不同之处:
- 没有“自带API密钥”的麻烦(我负责翻译API的费用)
- 保留格式(变量、复数形式、特殊字符)
- 简单的定价:每月19美元(或慷慨的免费计划)
- 由一位为自己应用使用它的开发者构建
技术细节:
- 使用AI进行翻译(比谷歌翻译更好地理解上下文)
- 在翻译前后验证字符串格式
- 处理iOS复数形式、Android字符串数组等
- 可以处理批量翻译(一次性翻译整个应用)
欢迎随时询问关于实施、定价、路线图或其他任何问题。
试试看: [https://locaflow.dev](https://locaflow.dev)(提供免费套餐,无需信用卡)
嗨,HN,
自从2023年AutoGPT推出以来,我对完全无监督的AI代理感到不安。我看到了生产力的提升,但“启动后就离开”让我觉得风险很大。
最近,“拉尔夫·维根循环”模式在网上走红。这个想法很简单:一个自主编码的代理会不断运行,直到所有的PRD项目完成,每次循环都有新的上下文,状态存储在模型外部,如git、JSON等。
让我感到困扰的是这一点:在我不在时,系统有什么保护措施?
目前传统的AI辅助开发流程是这样的:
AI编写代码 → 人类审核 → CI扫描 → 人类修复
而我想要的是:
AI编写代码 → 立即进行安全扫描 → AI修复问题 → 重复直到安全 → 如果卡住则升级给人类处理
因此,我构建了一个原型,将安全扫描直接嵌入代理循环中。代理在自己的会话中运行像Semgrep、Grype、Checkov等工具,查看发现的问题,并在任何内容提交之前进行迭代修复。
这个循环看起来是这样的:
PRD → 代理 → 扫描 → 通过? → 提交
失败 → 修复 → 重试(3次) → 升级给人类
几个重要的设计原则:
* 基线差异:预先存在的问题单独跟踪。只有新的发现会阻止提交。
* 沙箱约束:无网络访问,无sudo,无破坏性命令。
* 人类覆盖:没有任何东西是完全自主的。你可以在任何时候重新介入。
这是否万无一失?绝对不是。
它是否准备好投入生产?不。
但这是将DevSecOps思维应用于自主代理的起点,而不是单纯依赖“AI魔法”。
仓库链接: [https://github.com/agairola/securing-ralph-loop](https://github.com/agairola/securing-ralph-loop)
欢迎那些在代理循环、安全自动化或AI辅助开发中遇到问题的人提供反馈。
期待交流。
我们已预注册了一种可测试的协议,用于检测大型语言模型(LLMs)中的几何一致性推理。该协议预测在元认知状态下,Betti数、Kolmogorov-Smirnov(KS)熵和脆弱性在消融实验中会增加。欢迎进行复制研究。
<p>OSF协议: https://osf.io/2r6v8
预印本和案例研究: https://doi.org/10.5281/zenodo/18346699<p>这不是哲学——这是一个可证伪的数学假设。如果你有GPU访问权限和拓扑数据分析(TDA)/深度学习(DL)专业知识,你可以在一个周末内验证它。
我是一个自控力为零的开发者。“再写一个功能”最终变成了3个小时。
尝试过苹果的屏幕时间功能——每次都点击“忽略”。
也试过番茄钟应用——当它们变得烦人时就关闭了。
你们有什么有效的方法吗?硬件定时器?站立办公桌?屏蔽软件?
我正在开发一个macOS工具,使用全屏覆盖并设定30秒的冷却时间来绕过,但我很好奇其他人找到的有效方法。