2作者: Bleiglanz22 天前原帖
我对这种炒作曾经翻了个白眼,但实际上,<i>阅读</i>这方面的内容和<i>体验</i>它是完全不同的。如果你有任何旧的代码库,试试看,你可能会感到惊讶。 我不确定对于复杂的遗留企业系统,长期的“*90% 生产力*”的说法是否可信,但对于模板、库、构建工具和重构来说,收益是巨大的。那些耗时且令人紧张的工作大部分都得到了处理。 一开始你会像鹰一样仔细检查每一个差异,期待它会破坏东西,但老实说,很快你会发现大多数情况下这并不是必要的。你只需保持IDE开启,将“分析代码”的输出反馈给它。在Java中,告诉它“<i>添加checkstyle,运行mvn verify并修复</i>”的效果很好,你甚至可以去喝杯咖啡,而不是与linter警告作斗争。 理论上,剩下的只是<i>逻辑</i>和<i>想法</i>。当架构真正变得复杂时,我们将看看这一点是否成立。但目前,让它分支、创建模板并编写简单的测试,同时你只需在规格上进行迭代,效果出奇地好。只有在写下规格用普通英语太麻烦时,你才会编写源代码。 这提出了一个真正的问题:如果你的竞争对手Y刚刚解雇了90%的开发人员以节省成本,你会盲目跟随吗?还是会保留你的团队,利用这个巨大的杠杆,以一个远远更好的产品将Y彻底超越?
6作者: latand622 天前原帖
在过去几个月中,代理技能从一个小众的Claude Code功能发展成为每个主要运行时都支持的特性。Anthropic有一个官方的技能库。OpenAI在Codex中推出了内置的技能创建工具。Karpathy提到“所有问题都是技能问题”,并将编写技能描述为代理的课程[1]。格式正在趋同:一个包含SKILL.md的文件夹,可能还有一些可选脚本和参考文件。 变化在于模型的性能已经足够好,能够可靠地遵循书面指令。技能只是一个经过测试的工作流程,采用markdown格式,代理读取并遵循,而不是即兴发挥。你还可以捆绑在工作流程中运行的脚本,这涵盖了大多数人使用轻量级MCP服务器的用途,除了代理可以读取脚本源代码并进行扩展。 Karpathy谈到了“代理经济”,并表示我们应该停止为人类编写HTML文档,而是开始为代理编写markdown文档[1]。Anthropic刚刚推出了一款技能创建工具,可以在模型更新后基准测试技能是否仍然有效。GitHub上已经有成千上万的社区技能。 目前的分发仍然感觉比较早期。大多数有用的技能都很小。一个markdown文件,可能还有一个脚本。足够有用以便重复使用,但没有人会将其转变为一个完整的GitHub库,带有README和安装说明。因此,它们仍然停留在一台机器上。 我已经为自己的代理编写技能一段时间了,但不断遇到这个问题。格式是可行的,但在机器之间移动它们或将其交给其他人时却不太顺利。 我很好奇其他人是否也遇到同样的障碍,或者是否有我遗漏的方法。 [1] <a href="https:&#x2F;&#x2F;www.youtube.com&#x2F;watch?v=kwSVtQ7dziU" rel="nofollow">https:&#x2F;&#x2F;www.youtube.com&#x2F;watch?v=kwSVtQ7dziU</a>(Karpathy在No Briars播客中的讨论,技能讨论大约在1:03:40)
3作者: rokgregoric22 天前原帖
嘿,HN, 我喜欢在我的 Dock 中保留活动监视器,但默认的图标总让我觉得不太对劲。虽然它在技术上显示了活动,但在视觉上却感觉不太像是 macOS 的一部分——更像是一块原始的画布,而不是一个合适的系统图标。 所以我重新设计了它。 同样的应用程序,同样的数据——只是一个看起来和行为上更像原生 macOS 组件的 Dock 图标,配有干净、易读的 CPU 图表。 没有新增功能,只是修正了它的外观和感觉。 我很好奇其他人是否也注意到了这一点,或者这从来没有困扰过你。 [链接1](https://x.com/rokgregoric/status/2035638066853908844?s=20) [链接2](https://x.com/rokgregoric/status/2035641264461304028?s=20)
1作者: steveharing122 天前原帖
微软的第二代图像模型在Arena.ai上排名第三,提供强大的真实感和文本渲染能力,但目前存在1:1分辨率锁定、30秒冷却时间以及尚无编辑功能等限制。您可以在这里找到关于MAI-Image 2的所有信息,包括其令人印象深刻的能力和局限性:https://firethering.com/microsoft-mai-image-2/