最新

3 分•作者: terabytest•17 天前•原帖

我一直在尝试让自主编码（agentic coding）发挥作用，但我在网上看到的与我能够实现的之间的差异让我感到困惑。有没有超越炒作的真实证据表明自主编码能够产生净正面效果？如果你们中有人真的成功实现了这一点，能否详细分享一下你们是如何做到的？我所说的“成功实现”是指： * 创造的价值超过技术债务，且 * 生成的代码结构足够稳健，以至于负责架构的人可以签字认可。最近，我看到一种趋势，推崇最小化或根本不进行代码审查，声称我们应该从“验证架构”转向“验证行为”。在实践中，这似乎意味着：不看代码；如果测试和持续集成（CI）通过，就可以发布。我无法想象这种做法在长期内如何维持下去。我的预期是，最终会得到“意大利面条”代码（spaghetti code），虽然在理想情况下能运行，但随着时间的推移会积累微妙且难以调试的错误。当我尝试在现有代码库上使用Codex时，无论是否设置了保护措施，我花了一半的时间在修复它所犯的微小错误或引入的重复代码上。上个周末，我尝试从零开始构建一个用于宠物喂养提醒的iOS应用。我指示Codex首先研究并提出一个SwiftUI的架构蓝图。然后，我与它合作编写了一份描述应该实现什么以及如何实现的规范。第一次实现的结果出乎意料地好，尽管有一些错误。然而，事情很快就开始恶化。我花了周末的剩余时间让Codex使功能正常，修复错误而不引入新的错误，并研究最佳实践，而不是凭空捏造。尽管我让它记录我发现的新指南和保护措施，但情况并没有改善。最后，我只能放弃。我个人无法接受发布未经审查的代码。这让我觉得不对劲。产品必须正常工作，但代码也必须是高质量的。

问HN：你希望有什么样的API？

4 分•作者: tornikeo•17 天前•原帖

以下是我个人希望存在的一些API： 1. 一个公开的Google Trends API。目前它还处于测试阶段，我无法访问。 2. 我愿意为一个OpenAI趋势（或Anthropic趋势）等的API支付高额费用，以便了解人们正在讨论什么。 3. 我也希望有一个Discord的“趋势”API。同样，我想要回答的主要问题是“人们现在在谈论什么话题？” 你希望存在的API是什么？

在ATmosphere上发布

7 分•作者: danabramov•17 天前•原帖

当员工感到受到轻视时，他们的工作效率会降低。

36 分•作者: consumer451•17 天前•原帖

问HN：你读什么非小说类书籍？

2 分•作者: yanis_t•17 天前•原帖

分享一下你最近读过的有趣书籍吧。

Channel3（YC S25）正在招聘

1 分•作者: aschiff1•17 天前•原帖

安全地（危险地）运行Claude代码

1 分•作者: emilburzo•17 天前•原帖

计算您在X/Twitter上的影响力

1 分•作者: erikpau•17 天前•原帖

展示HN：TakaTime – 自托管的WakaTime替代方案（Go和MongoDB）

1 分•作者: Rtarun3606k•17 天前•原帖

GDPR作为风险意识架构的蓝图

1 分•作者: antonmb•17 天前•原帖

展示HN：AI换衣助手 – 具有姿势控制的虚拟试衣功能

1 分•作者: jokera•17 天前•原帖

本地模型以支持家庭网络基础设施？

1 分•作者: DrAwdeOccarim•17 天前•原帖

我在使用Claude Code管理我的家庭基础设施时感到非常兴奋。我一直以来都反对云计算，因此我不得不建立一个可以处理许多云功能的家庭设置。比如，我使用Resilio Sync来备份我家人的iOS照片，还有一个本地NAS来存储我合法下载并拥有的电影和电视节目。我还使用了一些树莓派，做一些本地的Home Assistant Z-Wave和Zigbee传感器。我的路由器、交换机和接入点都是UniFI，所有的摄像头、门铃和VoIP设备也是如此。总之，所有设备都是以本地为主（除了Talk，显然）。如你所想，维护这些不同系统的熵需要时间，而我现在有了小孩，时间更是有限。所以当Claude Code发布时，我就像鱼入水一样迅速上手。我们映射了我的整个网络，我在所有设备上创建了账户，以便它可以通过SSH连接并配置一切（包括Ubiquiti Dream Machine Pro！）。我对它的故障排除和修复能力感到惊讶。我有一台DGX Spark AI工作站（128GB内存），我现在真的想将工作交给一个本地模型，使用Opencode或Claude Code的工具，简单地指向一个通过API访问的vLLM实例化模型（只需将Opencode或Claude Code指向本地IP和API端点）。这本来是可行的，但我刚刚尝试了Qwen3-coder，它因安全问题拒绝提供帮助。真让人沮丧。然后我尝试了GLM-4.7-Flash，但vLLM尚不支持，所以在我重建（请求Claude Code重建和部署）以尝试GLM-4.7-Flash与其他推理提供者之前，有没有人有用于基础设施维护的模型，而不是一个麻烦的家伙？如果没有开源的模型能帮忙，我可能最终会转向一个被彻底改造的模型。

在您的终端中，AGI的基本构建模块

1 分•作者: bbokan•17 天前•原帖

已发布的ANN基准数据库管理系统结果可靠吗？

1 分•作者: AlexClickHouse•17 天前•原帖

排序算法可视化 [视频]

1 分•作者: dnnsthnnr•17 天前•原帖

展示 HN：治理的 AI 投资组合——用于生产中自主系统的准入控制

1 分•作者: lexseasson•17 天前•原帖

大多数代理失效并不是模型失效，而是组织记忆失效。<p>我为在事件后接受审计的团队构建了一个开源控制平面架构： - 决策是合同（而不是日志） - 治理是准入控制（而不是官僚主义） - 证据能够在团队更替中保存<p>包括：决策合同、持续集成门、审计级文档和三个受管控的变更胶囊。<p>GitHub: <a href="https://github.com/lexseasson/governed-ai-portfolio" rel="nofollow">https://github.com/lexseasson/governed-ai-portfolio</a>

小型Kafka：在免费t3.micro上使用Tansu和SQLite

15 分•作者: rmoff•17 天前•原帖

开发用的 Guix

27 分•作者: clircle•17 天前•原帖

展示HN：基于鸟类承载的IP传输与服务质量

7 分•作者: mig4ng•17 天前•原帖

g(old) 的中文翻译为“旧的 g”。

我将 OpenAI Codex 的评审提示移植到了 Gemini CLI。

1 分•作者: grainier•17 天前•原帖

上一页 1...251 252 253 254 255...4716 下一页