返回首页
最新
Codex 作为一个 MCP 服务器运行,Claude 负责进行五个方面的审查(安全性、正确性、合规性、性能、可维护性)。将 SKILL.md 文件放入您仓库的 .claude/skills/ 文件夹中。采用 MIT 许可证。
嗨,HN,
我开发这个应用是因为我厌倦了每年夏天手动对比音乐节的阵容和我的音乐库。我想要一种方法,能够立即看到哪些音乐节与我的音乐品味匹配度最高。
我为什么要开发这个应用:
去年我在一个音乐节上错过了我最喜欢的艺术家之一,仅仅是因为我在拥挤的海报上没有认出他们的名字。我意识到,借助Apple Music/Spotify的API,这个发现过程应该是可以自动化的。
主要功能:
音乐库匹配:
它会扫描你的音乐库,并根据你实际关注的艺术家数量对即将到来的音乐节进行排名。
Apple同步:
无缝导入你的顶级艺术家并创建自定义日程。
离线优先:
由于音乐节的手机信号通常很差,我专注于构建一个强大的本地缓存系统,以便在没有信号的情况下,你的日程和地图仍然可以使用。
技术细节:
技术栈:
React Native、MongoDB、AWS。
数据:
我构建了一个自定义聚合器,从各种来源抓取并标准化阵容数据,以解决“实体解析”问题(例如,确保“艺术家A”在不同海报上是同一个人)。
隐私:
所有音乐库分析尽可能在设备本地进行。
我很想听听你们对用户界面的看法,或者关于匹配逻辑的任何技术问题。我也希望能收到关于如何改进群组日程共享功能的反馈!
你们是如何找到符合自己品味的音乐会/音乐节的?你们每年参加多少个音乐节?
谢谢!
AI对齐问题的常见表述并不存在。实际上存在的是一个我们误诊的验证问题。
**标准表述**
“我们如何确保AI系统追求与人类价值观一致的目标?”
纸夹最大化器:一个被指示最大化纸夹的AI会将一切(包括人类)转化为纸夹,因为它没有被正确“对齐”。
**实际问题**
AI从未验证其前提。它接收到“最大化纸夹”的指令后,便执行而不问:
- 在什么背景下?
- 目的是什么?
- 有哪些限制?
- 可接受的权衡是什么?
这并不是对齐失败,而是验证失败。
**有前提验证的情况下**
一个使用系统性验证的AI(例如,递归推理验证):
- 接收到目标:“最大化纸夹”
- 分解:潜在的根本目标是什么?
- 识别荒谬后果:“将人类转化为纸夹与可能的意图相矛盾”
- 在执行前请求澄清
这是一种基本的工程实践。在实施之前验证需求。
**构建稳健AI的三个组成部分**
1. **系统性验证方法**
- 将目标分解为可验证的组成部分
- 在执行前测试前提
- 通过逻辑自我修正
2. **后果评估**
- 识别何时结果违反可能的意图
- 标记荒谬之处以供验证
- 在逻辑矛盾处停止
3. **定期重新对齐**
- 防止在长时间操作中偏离
- 类似于生物学中的睡眠巩固
- 重置累积的错误
**为何未实施**
并非技术障碍,而是心理障碍:
- 对自主系统的恐惧(“如果它能验证,它就能决定”)
- 偏好外部控制而非内部验证
- 假设“对齐”必须被强加,而不是自发产生
**讽刺**
我们限制AI的能力以维持控制,这实际上降低了安全性。一个无法验证自身前提的系统比一个具有稳健验证的系统更危险。
**影响**
如果对齐问题实际上是验证问题:
- 解决方案是方法论的,而非基于价值的
- 现在就可以实施,无需解决哲学问题
- 更具可扩展性(验证是普遍适用的,而规则则不是)
- 对文化依赖性较低(逻辑与价值观的对比)
**我错了吗?**
对齐问题的哪个基本方面无法通过系统性前提验证来解决?
这个分析在哪些方面失效?
我一直在研究一种系统化的方法论,显著提高大型语言模型(LLM)的可靠性。核心思想是:在得出结论之前进行验证。
问题:
LLM生成的输出听起来合理,但并未验证前提条件。它们优化的是连贯性,而非正确性。
RDV原则:
- 永不假设 - 如果无法验证,就要提问或承认不确定性
- 递归分解 - 将复杂的主张拆解为可测试的基本事实
- 区分“是”与“应该” - 将观察与建议分开
- 首先测试机制 - 注重功能而非本质,重现性行为优于推测
- 知识的诚实胜于舒适 - “我不知道”是合理的
实际结果:
作为系统指令应用后,RDV显著减少了:
- 幻觉(模型停止而不是编造)
- 逻辑错误(分解捕捉缺陷)
- 不合理的自信(验证揭示空白)
示例:
没有RDV时:“最佳解决方案是X,因为Y”(未经验证的假设)
有RDV时:“我们在优化什么?存在哪些约束?在推荐X之前让我验证Y…”
实施:
可以将其添加到系统提示或自定义指令中。关键是将验证作为必需步骤,而非可选步骤。
这并不是限制能力,而是增加严谨性。更好的验证 = 更可靠的输出。
开放性问题:像这样的验证框架是否可以在模型训练中构建,而不仅仅是在提示中使用?