1作者: railing10244 个月前原帖
嗨,HN, 我创建了Beauty Arena,旨在解决一个我一直觉得烦恼的数据问题:绝对评分尺度(1-10)对于主观数据来说非常糟糕。它们存在严重的膨胀现象和用户基准的不一致(一个人的7可能是另一个人的5)。 我想测试一下成对比较(1对1)是否能够产生一个更干净、严格相对的数据集。 系统不是问“这个人有多美?”,而是提出一个简单的问题:“你选择谁?”它在后台使用了受竞争游戏(Elo/Glicko)启发的排名系统。当用户投票时,基于与其他人的胜负比,全球排名逐渐显现,而不是基于累积的积分。 我对“群众智慧”的极限感到好奇。成对排序是否真的能收敛到一个明确的共识,还是因为不传递的偏好(A > B,B > C,但C > A)而无限循环? 我很想听听关于排名方法和整体用户界面的反馈。
1作者: jnamaya4 个月前原帖
我花了一年的时间构建SAFi,这是一个开源的认知架构,旨在围绕AI模型(如GPT、Claude等)进行封装,以确保与人类价值观的一致性。 SAFi是一种受经典哲学启发的“系统2”架构,它将生成与决策分开: - 智力:提出草案。 - 意志:决定是否阻止或批准草案。 - 良知:根据设定的核心价值观审核草案。 - 精神:一个EMA(指数移动平均)向量,跟踪“伦理漂移”随时间的变化,并在上下文窗口中注入纠正措施。 欢迎反馈!