返回首页

24小时热榜

1作者: nxy大约 8 小时前原帖
我创建ANMA是因为我注意到便宜的模型往往会忽视架构规则。因此,我进行了几次基准测试,使用“Claude Haiku 4.5”进行对比,有无ANMA的情况下进行测试;在没有ANMA的情况下,19次运行中有13次忽视了“规则”,而在有ANMA的情况下,20次运行中没有一次忽视。 什么是“ANMA”? YAML合约与CLAUDE.md、钩子和CI检查。 那么更强大/昂贵的模型呢? 它们遵循了架构规则。 问题是,是否更便宜的模型如果有更强的规则,会成为编码的最佳经济默认选择?