3作者: terabytest17 天前原帖
我一直在尝试让自主编码(agentic coding)发挥作用,但我在网上看到的与我能够实现的之间的差异让我感到困惑。 有没有超越炒作的真实证据表明自主编码能够产生净正面效果?如果你们中有人真的成功实现了这一点,能否详细分享一下你们是如何做到的? 我所说的“成功实现”是指: * 创造的价值超过技术债务,且 * 生成的代码结构足够稳健,以至于负责架构的人可以签字认可。 最近,我看到一种趋势,推崇最小化或根本不进行代码审查,声称我们应该从“验证架构”转向“验证行为”。在实践中,这似乎意味着:不看代码;如果测试和持续集成(CI)通过,就可以发布。我无法想象这种做法在长期内如何维持下去。我的预期是,最终会得到“意大利面条”代码(spaghetti code),虽然在理想情况下能运行,但随着时间的推移会积累微妙且难以调试的错误。 当我尝试在现有代码库上使用Codex时,无论是否设置了保护措施,我花了一半的时间在修复它所犯的微小错误或引入的重复代码上。 上个周末,我尝试从零开始构建一个用于宠物喂养提醒的iOS应用。我指示Codex首先研究并提出一个SwiftUI的架构蓝图。然后,我与它合作编写了一份描述应该实现什么以及如何实现的规范。 第一次实现的结果出乎意料地好,尽管有一些错误。然而,事情很快就开始恶化。我花了周末的剩余时间让Codex使功能正常,修复错误而不引入新的错误,并研究最佳实践,而不是凭空捏造。尽管我让它记录我发现的新指南和保护措施,但情况并没有改善。最后,我只能放弃。 我个人无法接受发布未经审查的代码。这让我觉得不对劲。产品必须正常工作,但代码也必须是高质量的。
4作者: tornikeo17 天前原帖
以下是我个人希望存在的一些API: 1. 一个公开的Google Trends API。目前它还处于测试阶段,我无法访问。 2. 我愿意为一个OpenAI趋势(或Anthropic趋势)等的API支付高额费用,以便了解人们正在讨论什么。 3. 我也希望有一个Discord的“趋势”API。同样,我想要回答的主要问题是“人们现在在谈论什么话题?” 你希望存在的API是什么?
1作者: DrAwdeOccarim17 天前原帖
我在使用Claude Code管理我的家庭基础设施时感到非常兴奋。我一直以来都反对云计算,因此我不得不建立一个可以处理许多云功能的家庭设置。比如,我使用Resilio Sync来备份我家人的iOS照片,还有一个本地NAS来存储我合法下载并拥有的电影和电视节目。我还使用了一些树莓派,做一些本地的Home Assistant Z-Wave和Zigbee传感器。我的路由器、交换机和接入点都是UniFI,所有的摄像头、门铃和VoIP设备也是如此。总之,所有设备都是以本地为主(除了Talk,显然)。 如你所想,维护这些不同系统的熵需要时间,而我现在有了小孩,时间更是有限。所以当Claude Code发布时,我就像鱼入水一样迅速上手。我们映射了我的整个网络,我在所有设备上创建了账户,以便它可以通过SSH连接并配置一切(包括Ubiquiti Dream Machine Pro!)。我对它的故障排除和修复能力感到惊讶。 我有一台DGX Spark AI工作站(128GB内存),我现在真的想将工作交给一个本地模型,使用Opencode或Claude Code的工具,简单地指向一个通过API访问的vLLM实例化模型(只需将Opencode或Claude Code指向本地IP和API端点)。 这本来是可行的,但我刚刚尝试了Qwen3-coder,它因安全问题拒绝提供帮助。真让人沮丧。然后我尝试了GLM-4.7-Flash,但vLLM尚不支持,所以在我重建(请求Claude Code重建和部署)以尝试GLM-4.7-Flash与其他推理提供者之前,有没有人有用于基础设施维护的模型,而不是一个麻烦的家伙?如果没有开源的模型能帮忙,我可能最终会转向一个被彻底改造的模型。
1作者: lexseasson17 天前原帖
大多数代理失效并不是模型失效,而是组织记忆失效。<p>我为在事件后接受审计的团队构建了一个开源控制平面架构: - 决策是合同(而不是日志) - 治理是准入控制(而不是官僚主义) - 证据能够在团队更替中保存<p>包括:决策合同、持续集成门、审计级文档和三个受管控的变更胶囊。<p>GitHub: <a href="https:&#x2F;&#x2F;github.com&#x2F;lexseasson&#x2F;governed-ai-portfolio" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;lexseasson&#x2F;governed-ai-portfolio</a>