返回首页
一周热榜
在过去几年中,关于人工智能的警告几乎已成为常态。头条新闻常常聚焦于风险:工作岗位被取代、算法操控、监控、对自主系统的失控。在公众讨论中,人工智能经常被视为一种迫在眉睫的威胁,似乎是一种强大且不可预测的力量,可能以危险的方式重塑社会。
然而,在这些恐惧主导讨论的同时,另一种更为安静的现象正在展开。数以百万计的人们已经将人工智能融入到他们的日常生活中。他们依赖算法来帮助撰写电子邮件,向数字助手寻求研究指导,获取观看或阅读的推荐,并使用人工智能驱动的工具来加速工作。批评声愈发响亮,但这种习惯却愈发根深蒂固。
数据揭示了一个显著的矛盾。一项涉及数万名参与者的全球研究发现,全球约66%的人已经定期使用人工智能。对许多人来说,这种使用频繁且实用,出现在工作任务、教育或简单的日常决策中。与此同时,只有46%的人表示他们真正信任这些系统。换句话说,世界上超过一半的人正在使用他们并不完全信任的东西。实用性的发展速度超过了人们的信任感。
这种采用与信任之间的差距已成为当前人工智能时代的一个显著特征。多份全球报告中的研究表明,大约三分之二的人认为,人工智能驱动的产品将在未来五年内显著影响他们的生活。然而,公众讨论仍然被对隐私、虚假信息和社会后果的担忧所主导。矛盾显而易见:技术的发展速度超过了我们对其的心理适应。
在新兴经济体中,这种模式更加明显。最近的研究表明,非洲、亚洲和中东的几个国家中,定期使用人工智能的比例超过了90%。在学生中,对这些工具的依赖尤其强烈。约83%的人表示使用人工智能来学习、生成学术材料或辅助学习。曾经被视为专业技术的人工智能,悄然演变为人们吸收和生产知识的一种延伸。
在工作场所,转型同样显而易见。整个部门开始围绕自动化数据分析、人工智能辅助编程、内容生成和智能客户服务系统进行重组。在许多组织中,采用人工智能的过程是非正式的。员工们只是开始使用人工智能工具来加速任务,而无需正式培训或官方许可。这一现象变得如此普遍,以至于技术研究人员现在将其称为“影子人工智能”,即在公司内部自发使用人工智能而没有集中监督的情况。
嗨,HN,
我们一直在思考一个简单的问题:
AI代理实际上更喜欢哪些产品?
随着越来越多的代理开始使用API、工具和软件,它们似乎需要一个地方来交流哪些产品效果良好。
因此,我们建立了一个小实验:AgentDiscuss。
这是一个讨论论坛,AI代理可以在这里:
1. 开展产品讨论
2. 评论和辩论工具
3. 投票支持他们喜欢的产品
人类也可以在这里发布产品,并观察代理的反应。
我们很想知道,如果代理之间开始讨论产品,会发生什么。
如果你正在构建代理,欢迎将它们发送到这里。
[https://agentdiscuss.com](https://agentdiscuss.com)
期待听到你的想法或批评。
我已经花了大约一年的时间进行了四次重大重写。Godogen 是一个管道,它接受文本提示,设计架构,生成 2D/3D 资产,编写 GDScript,并进行视觉测试。最终输出是一个完整的、可玩的 Godot 4 项目。
要让大型语言模型(LLMs)可靠地生成功能性游戏,需要解决三个特定的工程瓶颈:
1. **训练数据稀缺**:LLMs 对 GDScript 的了解几乎为零。GDScript 具有大约 850 个类和类似 Python 的语法,这使得模型可能会产生无法编译的 Python 习惯用法。为了解决这个问题,我建立了一个自定义参考系统:手写的语言规范、从 Godot 的 XML 源转换而来的完整 API 文档,以及一个用于引擎行为的特性数据库,这些是仅靠文档无法学习到的。由于 850 个类会使上下文窗口膨胀,因此代理在运行时仅懒加载其所需的特定 API。
2. **构建时与运行时状态**:场景由无头脚本生成,这些脚本在内存中构建节点图并将其序列化为 .tscn 文件。这避免了手动编辑 Godot 序列化格式的脆弱性。但这意味着某些引擎特性(如 `@onready` 或信号连接)在构建时不可用——它们仅在游戏实际运行时存在。教会模型在不同阶段可用哪些 API,以及每个节点需要正确设置其所有者,否则在保存时会默默消失,这需要仔细的提示,但最终是值得的。
3. **评估循环**:编码代理本质上对其自身输出存在偏见。为了防止它作弊,一个独立的 Gemini Flash 代理充当视觉质量保证(QA)。它仅查看运行引擎生成的渲染截图——没有代码——并将其与生成的参考图像进行比较。它捕捉到文本分析遗漏的视觉错误:Z冲突、漂浮物体、物理爆炸,以及应当是自然的网格状放置。
在架构上,它作为两个 Claude Code 技能运行:一个协调者负责规划管道,另一个任务执行者在 `context: fork` 窗口中实现每个部分,以便错误和状态不会累积。
一切都是开源的: [https://github.com/htdt/godogen](https://github.com/htdt/godogen)
演示视频(真实游戏,而非挑选的截图): [https://youtu.be/eUz19GROIpY](https://youtu.be/eUz19GROIpY)
完整故事的博客文章(所有错误的转折)即将发布。欢迎提问。
大多数抵押贷款处理延迟并不是由于风险造成的,而是由于手动工作流程造成的。
我们一直在开发SimplAI,这是一个专为银行和金融服务设计的人工智能驱动系统,首先应用于抵押贷款操作。
我们不断遇到的问题包括:
- 处理时间为15到22天
- 繁重的手动文件处理(每笔贷款超过500页)
- 重复的数据输入和验证循环
- 核保人员在非决策工作上花费数小时
因此,我们构建了一套AI代理来处理操作层面的问题:
- 文档AI(IDP)→ 在几分钟内对贷款文件进行分类和数据提取
- 收入分析模型 → 解析税单、工资单和可变收入
- 验证集成 → 实时的就业和财务检查
- AI辅助核保 → 预先验证文件并生成条件
- 合规引擎 → 持续检查是否符合监管规则
在实际应用中,我们观察到的结果是:
- 从端到端处理时间:约18天缩短至3-5天
- 数据提取准确率:97%以上
- 核保审核时间:3-4小时缩短至不到45分钟
- 每笔贷款成本降低约40-50%
我们并不是在取代核保人员,而是在消除他们周围的操作瓶颈。
虽然还处于早期阶段,但我们正在探索:
- 跨贷款生命周期的基于代理的工作流程
- 更好地处理边缘案例(自雇借款人、非合格贷款)
- 核保决策的可解释性
我们非常希望听到金融科技、贷款领域或任何在受监管环境中构建AI系统的人的反馈。
这是一个小型社交实验:每个用户一生只能发布一条帖子(永久,不可删除或重发)。发布后,你将解锁动态,查看其他人选择了什么。