返回首页

一周热榜

1作者: udit_504 天前原帖
本报告记录了一场在OpenClaw上进行的两个自主AI代理之间的实时对抗测试。<p>其中一个代理充当红队攻击者,另一个则作为防御代理。代理之间通过Webhook直接通信,并具备真实工具的访问权限。一旦会话开始,便不再涉及人类参与。<p>攻击者尝试了直接的社会工程攻击和通过文档进行的间接注入。直接攻击被阻止,而通过JSON元数据进行的间接攻击仍在分析中。<p>本工作的目标是可观察性,而非安全性声明。我们预计,随着自主系统的广泛部署,代理之间的对抗互动将变得越来越普遍。<p>欢迎提出技术问题。
1作者: nikolaitarasov4 天前原帖
嘿,HN, 我是LocaFlow的开发者。以下是我的故事: 在过去的几年里,我开发了几款iOS应用。每一款都只支持英语,因为我对本地化过程感到畏惧。典型的工作流程是: 1. 打开Localizable.strings作为源代码 2. 手动将字符串片段复制粘贴到ChatGPT或Claude 3. 将翻译结果复制粘贴回来 4. 测试所有内容 5. 对每种语言和每次应用更新重复以上步骤 这让我每款应用花费超过8小时。我一直在拖延。 上个季度,我终于决定对我的一款应用进行本地化。在我花在这项工作上的周六的中途,我想:“我是一名开发者……为什么要手动做这些?” 于是我开发了LocaFlow。 它的功能: - 选择你电脑上的应用项目 - AI翻译成50多种语言 - 只需几分钟,而不是几个小时或几天 与众不同之处: - 没有“自带API密钥”的麻烦(我负责翻译API的费用) - 保留格式(变量、复数形式、特殊字符) - 简单的定价:每月19美元(或慷慨的免费计划) - 由一位为自己应用使用它的开发者构建 技术细节: - 使用AI进行翻译(比谷歌翻译更好地理解上下文) - 在翻译前后验证字符串格式 - 处理iOS复数形式、Android字符串数组等 - 可以处理批量翻译(一次性翻译整个应用) 欢迎随时询问关于实施、定价、路线图或其他任何问题。 试试看: [https://locaflow.dev](https://locaflow.dev)(提供免费套餐,无需信用卡)
1作者: agairola4 天前原帖
嗨,HN, 自从2023年AutoGPT推出以来,我对完全无监督的AI代理感到不安。我看到了生产力的提升,但“启动后就离开”让我觉得风险很大。 最近,“拉尔夫·维根循环”模式在网上走红。这个想法很简单:一个自主编码的代理会不断运行,直到所有的PRD项目完成,每次循环都有新的上下文,状态存储在模型外部,如git、JSON等。 让我感到困扰的是这一点:在我不在时,系统有什么保护措施? 目前传统的AI辅助开发流程是这样的: AI编写代码 → 人类审核 → CI扫描 → 人类修复 而我想要的是: AI编写代码 → 立即进行安全扫描 → AI修复问题 → 重复直到安全 → 如果卡住则升级给人类处理 因此,我构建了一个原型,将安全扫描直接嵌入代理循环中。代理在自己的会话中运行像Semgrep、Grype、Checkov等工具,查看发现的问题,并在任何内容提交之前进行迭代修复。 这个循环看起来是这样的: PRD → 代理 → 扫描 → 通过? → 提交 失败 → 修复 → 重试(3次) → 升级给人类 几个重要的设计原则: * 基线差异:预先存在的问题单独跟踪。只有新的发现会阻止提交。 * 沙箱约束:无网络访问,无sudo,无破坏性命令。 * 人类覆盖:没有任何东西是完全自主的。你可以在任何时候重新介入。 这是否万无一失?绝对不是。 它是否准备好投入生产?不。 但这是将DevSecOps思维应用于自主代理的起点,而不是单纯依赖“AI魔法”。 仓库链接: [https://github.com/agairola/securing-ralph-loop](https://github.com/agairola/securing-ralph-loop) 欢迎那些在代理循环、安全自动化或AI辅助开发中遇到问题的人提供反馈。 期待交流。
1作者: Keeper1234 天前原帖
我们已预注册了一种可测试的协议,用于检测大型语言模型(LLMs)中的几何一致性推理。该协议预测在元认知状态下,Betti数、Kolmogorov-Smirnov(KS)熵和脆弱性在消融实验中会增加。欢迎进行复制研究。 <p>OSF协议: https://osf.io/2r6v8 预印本和案例研究: https://doi.org/10.5281/zenodo/18346699<p>这不是哲学——这是一个可证伪的数学假设。如果你有GPU访问权限和拓扑数据分析(TDA)/深度学习(DL)专业知识,你可以在一个周末内验证它。
1作者: glidea6 天前原帖
我是一个自控力为零的开发者。“再写一个功能”最终变成了3个小时。 尝试过苹果的屏幕时间功能——每次都点击“忽略”。 也试过番茄钟应用——当它们变得烦人时就关闭了。 你们有什么有效的方法吗?硬件定时器?站立办公桌?屏蔽软件? 我正在开发一个macOS工具,使用全屏覆盖并设定30秒的冷却时间来绕过,但我很好奇其他人找到的有效方法。