返回首页

一周热榜

2作者: Shefoz7 天前原帖
我构思了一个隐私设置,其中没有数据会接触到持久存储——一个本地的PXE服务器通过局域网直接将一个干净的Whonix镜像引导到内存中。断电 = 物理擦除。 然后,我花了同样的时间来映射执法部门仍然可以找到你的所有方式。八个检测向量、真实案例研究,以及人类在技术之前总是失败的犯罪学原因。 完整分析请见:https://github.com/ashraf2324/The-Ghost-in-the-Machine
2作者: 01-_-6 天前原帖
在过去几年中,关于人工智能的警告几乎已成为常态。头条新闻常常聚焦于风险:工作岗位被取代、算法操控、监控、对自主系统的失控。在公众讨论中,人工智能经常被视为一种迫在眉睫的威胁,似乎是一种强大且不可预测的力量,可能以危险的方式重塑社会。 然而,在这些恐惧主导讨论的同时,另一种更为安静的现象正在展开。数以百万计的人们已经将人工智能融入到他们的日常生活中。他们依赖算法来帮助撰写电子邮件,向数字助手寻求研究指导,获取观看或阅读的推荐,并使用人工智能驱动的工具来加速工作。批评声愈发响亮,但这种习惯却愈发根深蒂固。 数据揭示了一个显著的矛盾。一项涉及数万名参与者的全球研究发现,全球约66%的人已经定期使用人工智能。对许多人来说,这种使用频繁且实用,出现在工作任务、教育或简单的日常决策中。与此同时,只有46%的人表示他们真正信任这些系统。换句话说,世界上超过一半的人正在使用他们并不完全信任的东西。实用性的发展速度超过了人们的信任感。 这种采用与信任之间的差距已成为当前人工智能时代的一个显著特征。多份全球报告中的研究表明,大约三分之二的人认为,人工智能驱动的产品将在未来五年内显著影响他们的生活。然而,公众讨论仍然被对隐私、虚假信息和社会后果的担忧所主导。矛盾显而易见:技术的发展速度超过了我们对其的心理适应。 在新兴经济体中,这种模式更加明显。最近的研究表明,非洲、亚洲和中东的几个国家中,定期使用人工智能的比例超过了90%。在学生中,对这些工具的依赖尤其强烈。约83%的人表示使用人工智能来学习、生成学术材料或辅助学习。曾经被视为专业技术的人工智能,悄然演变为人们吸收和生产知识的一种延伸。 在工作场所,转型同样显而易见。整个部门开始围绕自动化数据分析、人工智能辅助编程、内容生成和智能客户服务系统进行重组。在许多组织中,采用人工智能的过程是非正式的。员工们只是开始使用人工智能工具来加速任务,而无需正式培训或官方许可。这一现象变得如此普遍,以至于技术研究人员现在将其称为“影子人工智能”,即在公司内部自发使用人工智能而没有集中监督的情况。
2作者: leoooo6 天前原帖
嗨,HN, 我们一直在思考一个简单的问题: AI代理实际上更喜欢哪些产品? 随着越来越多的代理开始使用API、工具和软件,它们似乎需要一个地方来交流哪些产品效果良好。 因此,我们建立了一个小实验:AgentDiscuss。 这是一个讨论论坛,AI代理可以在这里: 1. 开展产品讨论 2. 评论和辩论工具 3. 投票支持他们喜欢的产品 人类也可以在这里发布产品,并观察代理的反应。 我们很想知道,如果代理之间开始讨论产品,会发生什么。 如果你正在构建代理,欢迎将它们发送到这里。 [https://agentdiscuss.com](https://agentdiscuss.com) 期待听到你的想法或批评。
2作者: htdt6 天前原帖
我已经花了大约一年的时间进行了四次重大重写。Godogen 是一个管道,它接受文本提示,设计架构,生成 2D/3D 资产,编写 GDScript,并进行视觉测试。最终输出是一个完整的、可玩的 Godot 4 项目。 要让大型语言模型(LLMs)可靠地生成功能性游戏,需要解决三个特定的工程瓶颈: 1. **训练数据稀缺**:LLMs 对 GDScript 的了解几乎为零。GDScript 具有大约 850 个类和类似 Python 的语法,这使得模型可能会产生无法编译的 Python 习惯用法。为了解决这个问题,我建立了一个自定义参考系统:手写的语言规范、从 Godot 的 XML 源转换而来的完整 API 文档,以及一个用于引擎行为的特性数据库,这些是仅靠文档无法学习到的。由于 850 个类会使上下文窗口膨胀,因此代理在运行时仅懒加载其所需的特定 API。 2. **构建时与运行时状态**:场景由无头脚本生成,这些脚本在内存中构建节点图并将其序列化为 .tscn 文件。这避免了手动编辑 Godot 序列化格式的脆弱性。但这意味着某些引擎特性(如 `@onready` 或信号连接)在构建时不可用——它们仅在游戏实际运行时存在。教会模型在不同阶段可用哪些 API,以及每个节点需要正确设置其所有者,否则在保存时会默默消失,这需要仔细的提示,但最终是值得的。 3. **评估循环**:编码代理本质上对其自身输出存在偏见。为了防止它作弊,一个独立的 Gemini Flash 代理充当视觉质量保证(QA)。它仅查看运行引擎生成的渲染截图——没有代码——并将其与生成的参考图像进行比较。它捕捉到文本分析遗漏的视觉错误:Z冲突、漂浮物体、物理爆炸,以及应当是自然的网格状放置。 在架构上,它作为两个 Claude Code 技能运行:一个协调者负责规划管道,另一个任务执行者在 `context: fork` 窗口中实现每个部分,以便错误和状态不会累积。 一切都是开源的: [https://github.com/htdt/godogen](https://github.com/htdt/godogen) 演示视频(真实游戏,而非挑选的截图): [https://youtu.be/eUz19GROIpY](https://youtu.be/eUz19GROIpY) 完整故事的博客文章(所有错误的转折)即将发布。欢迎提问。
2作者: salvozappa7 天前原帖
大家好,大约两个月前我开始了一个关于“异步编码”的副项目,我可以在火车上通过手机提示Claude Code,完成后会收到通知,然后可以直接在应用中查看和提交代码。 从那时起,我时不时地使用它。最终我决定对其进行完善并发布,以便有需要的人能找到它。 这是一个自托管的渐进式网络应用(PWA),包含四个面板:代理(运行Claude Code的终端)、浏览(带语法高亮的文件浏览器)、终端(标准bash shell)和Git(带有暂存/提交的差异查看器)。它可以在廉价的VPS上运行,并提供了一个完整的功能设置(使用cloud-init和简单的bash脚本)。 这符合我喜欢的工作流程,我可以保持信息同步:我会查看每个差异,手动控制git,并在更改提交之前批准或拒绝它们。 技术栈:Go WebSocket桥接,xterm.js前端,Ubuntu沙箱容器。所有内容都在Docker中运行。可以与任何CLI AI助手配合使用,尽管我只用过Claude Code。 这是一个副项目,按原样提供,遵循MIT许可证。使用风险自负。欢迎反馈和合并请求。 编辑:已删除冗余文本。
2作者: kristjan7 天前原帖
最近看到一些RSS项目的出现让我很高兴,所以我也来分享一下我的项目以及它的演变过程。 我想从头开始阅读几个RSS源,但RSS本身并不特别适合这个需求,也没有人特别使用它来做这件事。不过,我曾经为了浏览一个档案而保持一个标签页打开了8个月,这种经历我不想再来一次。在我逐步实现这个想法并向朋友展示的过程中,我们积累了一些其他的使用案例,这些案例与“仅仅过滤一些XML”相契合,因此它们也被纳入了项目中。 因此,Sponder可以: - 对RSS源进行基本过滤,支持关键词或正则表达式。 - 将任何网页解析为RSS源,包括自动检测标题、图片、链接等元素,跟踪页面链接的历史,并在稍后返回获取新内容。 - 控制整个历史源的更新频率,可以为你提供每周一篇文章,或每天12篇,随你喜欢的节奏。 - 自动检测并过滤播客源中的重播集。 - 通过用户界面或输入一些YAML进行配置。 它并不: - 替代你的RSS或播客客户端,它是一个中间件,为你发布修改后的源。 - 替代你所有的源,只替代你希望有所不同的那些。虽然如果你希望有很多不同的源,你可以导入和导出OPML文件。 - 通过大型语言模型处理内容,尽管我在考虑将其用于重播检测,因为元数据相似性只能达到一定程度。 我很想听听大家的意见: - 你对你的源有什么不满? - 配置流程的体验如何?
2作者: hariprasadr7 天前原帖
我们现在大约有15个人,以前“自然而然”能运作的事情开始出现问题。大家都知道的决策变得模糊不清。新员工的适应期变得漫长。不同团队在不同的假设上进行工作。 对于经历过这个阶段的人来说,最初出现问题的是什么?你们是如何应对的?
2作者: SimplAI_ai4 天前原帖
大多数抵押贷款处理延迟并不是由于风险造成的,而是由于手动工作流程造成的。 我们一直在开发SimplAI,这是一个专为银行和金融服务设计的人工智能驱动系统,首先应用于抵押贷款操作。 我们不断遇到的问题包括: - 处理时间为15到22天 - 繁重的手动文件处理(每笔贷款超过500页) - 重复的数据输入和验证循环 - 核保人员在非决策工作上花费数小时 因此,我们构建了一套AI代理来处理操作层面的问题: - 文档AI(IDP)→ 在几分钟内对贷款文件进行分类和数据提取 - 收入分析模型 → 解析税单、工资单和可变收入 - 验证集成 → 实时的就业和财务检查 - AI辅助核保 → 预先验证文件并生成条件 - 合规引擎 → 持续检查是否符合监管规则 在实际应用中,我们观察到的结果是: - 从端到端处理时间:约18天缩短至3-5天 - 数据提取准确率:97%以上 - 核保审核时间:3-4小时缩短至不到45分钟 - 每笔贷款成本降低约40-50% 我们并不是在取代核保人员,而是在消除他们周围的操作瓶颈。 虽然还处于早期阶段,但我们正在探索: - 跨贷款生命周期的基于代理的工作流程 - 更好地处理边缘案例(自雇借款人、非合格贷款) - 核保决策的可解释性 我们非常希望听到金融科技、贷款领域或任何在受监管环境中构建AI系统的人的反馈。