返回首页
一周热榜
我刚刚出版了我的第一本书《手段与动机》。(<a href="https://www.amazon.com/dp/B0GYCZJVGX" rel="nofollow">https://www.amazon.com/dp/B0GYCZJVGX</a>)
作为一名软件工程师,我将写作视为一个软件项目。我使用熟悉的工具(Emacs和HTML)进行主要写作。
我构建了自己的工具(EPublish),将HTML手稿转换为.epub文件,这是电子书版本的源文件。同时,我编写了Shell脚本,以可靠且可重复的方式将.epub版本转换为打印版的PDF文件。
我撰写了“设计”和“架构”文档,描述了世界观、关键角色和时间线。我保持了一份章节和关键场景的任务清单,按优先级排序。在这个过程中,我对文件进行了版本控制,这样我就可以看到小说的进展,并毫不留情地进行编辑,而不必担心如果出于某种原因想要旧文本时会在备份文件中找不到。
如果你考虑过写一本书,我强烈推荐你去做。写作过程与软件工程有许多相似之处。你也会对设计、排版和印刷的世界有新的认识,了解到每本书的背后有多少工作。
在观看了Anthropic最近的事后分析(anthropic.com/engineering/april-23-postmortem)后,我开始思考我对Claude Code的不同处理方式。他们降低了默认的推理努力以修复延迟,称之为错误的权衡,并在公众审查下进行了回退。虽然这些回退是好的,但并没有改变我一直忽视的基本方程。
事实上,我们现在可能有一支工程师团队可供使用。令牌成本是真实的成本,但我无法为我个人的工作雇佣自己的工程师。如果用这种视角来看待令牌使用,思路就会发生变化。它不再是关于成本上限的问题,而是变成了成本/产出/质量的视角,就像我在真实团队中考虑雇佣决策一样。
我现在关注的四个方面是:模型、配置、提示和代理。
关于模型。Opus在关键决策和架构推理方面仍然是最强的。Sonnet通常足够用于编码和简单的重复性任务。我会根据工作选择合适的模型。如果我贪图便宜,就不能指望质量。
关于配置。/effort的范围从低到高。Opus 4.7的默认值是xhigh。我会根据工作调整级别。快速编辑不需要最大值,而架构决策则需要。这是我之前一直忽视的最便宜的选择。
关于提示:我发现最有效的三种模式。
1. “如果不确定,请提问。”没有这个,我就没有给模型留出余地,这会限制解决方案,即使没有明确的答案,也需要显露权衡。
2. “时间和成本在这里不是因素。优先考虑稳健、可持续、可扩展的解决方案,不留下技术债务。”这反转了任务执行期间隐含的优化压力。
3. “反思本次会话,并通过claude.md或技能记录你所学到的,以便下一次迭代不再重复同样的错误。”值得将其作为技能记录并为自己迭代。没有这个,每次会话都从零开始,重复我已经纠正的错误。
关于代理。虽然不想详细展开,因为这本身就是一个完整的主题,但对我有效的模式是使用代理来分离关注点。一个代理负责对代码进行规范审查(代码是真实来源),另一个代理在实施后进行代码审查。
工程和产品团队一直在市场速度与成本和质量之间取得平衡。人工智能也不例外。不同之处在于我选择了哪些杠杆。故意在努力上花费预算,工作就会以我想要的水平回报。
好好享受磁盘碎片整理工具吧。
Furwall 是一款小巧的 macOS 菜单栏应用。当您在键盘或鼠标前时,FaceTime 摄像头会寻找人脸或上半身。当没有检测到人脸时,键盘将停止接受输入。即使猫咪走过您的笔记本电脑,您的代码也不会受到影响。
一些说明:
苹果的 Vision 框架在本地运行。视频在内存中处理,绝不会上传。在一个块中,Furwall 会保存一张本地 JPEG 到 ~/.furwall/catpures/。第二次 Vision 处理会丢弃任何不是猫的图像,因此菜单中的每日计数仅反映确认的猫。目前我的磁盘上有一个文件夹,里面慢慢积累着 Pepper 和 Beets 走过我键盘的照片。
摄像头仅在您使用电脑时(输入、鼠标移动、应用切换、屏幕唤醒)开启,并在最后一次活动后 30 秒关闭。绿色摄像头指示灯会跟踪这一点。
按键丢失使用的是 .defaultTap 的 CGEventTap。由于这个原因,Furwall 是以未沙盒化的方式发布的。一个带有输入监控的 .listenOnly tap 足以查看按键,但要丢弃它们需要 .defaultTap,而这需要无障碍功能,而应用沙盒会阻止这一点。观察按键是兼容沙盒的;而阻止它们则不是。
鼠标事件会被观察(以唤醒摄像头),但从不被拦截或丢弃,因此菜单栏始终有效。有三种逃生方式:点击图标并退出,在 1.5 秒内按五次 Escape 键以暂停 5 分钟,或在系统设置中撤销无障碍功能(macOS 会使 tap 无效)。如果 Vision 因任何原因停滞,键盘在 10 秒后会自动恢复,这比让机器软砖要好。
Furwall 从不上传摄像头帧或按键。它自己的网络流量仅包括 Sparkle 更新检查和捐赠页面的匿名总数/点击计数。每次点击只会产生一条简短的慈善信息,没有用户标识符。
菜单中的捐赠项目会打开一个经过审核的动物福利慈善机构的捐赠页面,适用于您的系统区域。十个组织覆盖九个地区:美国的 Alley Cat Allies 和 PetSmart Charities,英国的 Cats Protection,澳大利亚的 Cat Protection Society NSW,加拿大的 Toronto Cat Rescue,爱尔兰的 NSPCA,新西兰的 SPCA,德国的 Deutscher Tierschutzbund,法国的 La SPA 和 Fondation 30 Millions d'Amis,日本的 Japan SPCA。每个组织都在其当地的慈善或非营利制度下注册或认可,并且该列表在每次发布时都会重新审核。应用程序中没有资金流动。
支持 macOS 15 及以上版本,已签名和公证,采用 MIT 许可证。
<a href="https://olliewagner.com/furwall" rel="nofollow">https://olliewagner.com/furwall</a>
我最初只是随便玩弄 pi-autoresearch。给它设定了一个样本任务,构建一个最便携的编码代理。
第一次尝试是 6 KB 的 shell。对于一次性任务来说很不错,但交互使用时就没法用了。我很震惊它居然真的能工作。
开始逐步构建——添加功能——但我给自己设定了一个规则:不引入新的依赖,代码行数不超过 500。这东西必须真正便携。只使用 sh、curl 和 awk。仅限系统原语。
这意味着我在 awk 中做了一些非常恶心的事情,包括 JSON 解析和 OpenAI 响应工具循环,推理项在回合之间传递。
现在大约有 400 行代码。在这个框架中:Anthropic + OpenAI,7 个工具(bash、read、write、edit、grep、find、ls),REPL、自动压缩、检查点/恢复、管道模式,90 个无 API 测试。不在框架中的有:TUI、流式处理、图像、OAuth、Windows、尊严。
两个诚实的事实:
1. 我窃取/修改了系统提示和架构。Pi/Claude/Codex 写了 awk。我无法阅读大部分代码。一年前我是做不到的。
2. 深受 Pi(pi.dev)的启发——相同的 7 个工具界面,完全相同的文本编辑模型。应当给予应有的认可。Pi 非常棒——你可能应该使用他们的工具。
代理循环本身很小。几乎所有其他“真实”代理 CLI 的内容都是开发体验和加固。你可能可以完全按照自己的喜好构建自己的工具框架。Mario Zechner 的 AI 工程师演讲让我在这方面有所启发。
这个名字是因为它是一个 .sh 文件。另一个听起来像的东西,遗憾的是,也同样准确。
除了 uBlock Origin 和 Saka Key,没有其他扩展程序在运行。
只有一条消息,包含一些简短的文本和代码。
这是在安装更新后的“冷启动”状态。
16GB 的内存显然已经远远不够,几乎就像 2016 年的 2GB 一样。
人工智能是否在增加销售额或改善重度使用它的公司的整体前景?这里不仅仅指编码的应用案例,而是指由于直接或间接使用人工智能带来的额外好处,整体收益或收入的改善。
我有一个开源项目即将上线,但我发现我无法发布 ShowHN 的帖子。给我的解释非常模糊,我不确定我应该做些什么才能符合资格?是否有一些具体的指示,比如“账户需要注册多少天”或“账户需要获得多少帖子/评论/点赞”才能符合资格?感谢您的指导。
嗨,HN!Flocklist.app 是一款极简的私人依赖追踪工具。
我主要是为自己开发这个应用,因为每次坐下来工作时,查看待办事项列表,却发现自己无法完成其中的 2/3 的任务。市面上的解决方案要么使用起来不够顺畅,要么是企业级的(比如 Jira、Linear 等等)。我想我不可能是唯一有这个问题的人,所以我开发了这个免费的应用来解决它。(它也不在云端存储任务。)
我非常希望听到你们的反馈!
我在以规范驱动的方法上遇到了很多问题,代理过于容易产生无用的信息,大型项目有太多的规范,代理在维护这些规范时开始出错。这导致了持续的协调成本。
最终,每个规范只是一堆事实,因此我决定放弃这些,抛弃其他所有内容,同时使其更适合代理使用。
现在介绍事实——供代理使用的技能和命令行接口,以便进行基于事实的开发。
[https://github.com/av/facts](https://github.com/av/facts)