返回首页
最新
看到很多人使用自定义沙箱(如Docker/VMs、firejail/bubblewrap)来运行编码代理(如Claude Code等),以及一些限制文件或网络访问的脚本。我很好奇,是什么导致人们需要自己动手做这些?那么,什么样的标准才算是“足够好”?
答案很简单:你对Claude的指示越“规定性”,输出结果就越糟糕。原因在于Claude试图进行模式匹配——它接受过数千种安全用户界面模式的训练,这就是为什么当你要求“一个现代化的仪表板”时,它并不会真正考虑问题的领域,而是默认使用它能迅速生成的任何安全设计模式。
我一直在开发一个Claude Code技能,以应对通用用户界面的输出,并尝试了不同的方法,比如详细描述我的个人视觉风格,例如边框使用的透明度值、特定的标记模式等。虽然我得到了还算不错的输出,但我意识到在不同指令下,大多数视觉输出看起来都很相似,缺乏创造性和信息架构的多样性。
因此,我分析并拆解了官方的前端设计技能,以了解它如何在创意任务中表现出色。我发现这个技能主要是基于原则和引发联想的,这在思考时非常聪明。它在激发创造力和保持不同任务范围内的结构之间保持了恰到好处的平衡。
所以我的方法发生了变化。我决定使用相同的模式来构建我的技能:详细阐述我的设计原则,但以引发联想的方式来框架这些原则,以迫使Claude在任何视觉输出之前深入探索任务领域(欢迎批评我的方法,但嘿,这确实有效)。从那时起,我从Claude那里得到了更加深思熟虑的初始输出,而不是默认使用它所训练的安全用户界面模式。
我为这个技能设定的目标是补充Anthropic的前端设计技能。虽然前端设计专注于任何网页用户界面的独特、令人难忘的美学,但界面设计则旨在在功能接口(如仪表板、工具、网页应用)之间保持系统的一致性,在这些地方,设计决策需要在多个会话中持续并累积。
我尽量不被这里的热潮所影响。我很好奇你们到目前为止用claude-code实际构建或发布了什么。
我为我的孩子们制作了一个小的语音闪卡游戏,链接在这里:[3 Letter Stories](https://apps.apple.com/us/app/3letterstories/id6753956099)。
此外,还有一个与此相关的工具,用于微调闪卡上的图像(这些图像都是在gemini上生成的AI图像)。
还有一些内部工具——一个自包含的页面,用于可视化JSON/Python字典,这显然已经存在。
目前还没有什么大项目,但这才过去几天。这个工具在构建前端/仪表板方面确实看起来非常出色。
在2000年代初泡沫破裂时,面试的情况如何?<p>那时的情况是否和现在一样糟糕?
我一直在整理关于物理人工智能的论文——这是基础模型与机器人技术的交叉领域。这包括视觉-语言-行动(VLA)模型,如RT-2和π₀,世界模型(DreamerV3、Genie 2、JEPA),扩散策略,现实世界的部署和延迟问题,跨体现转移,规模法则,以及机器人的安全性/对齐问题。
在过去的18个月里,这个领域迅速发展。我们从“尝试将大型语言模型应用于机器人技术”发展到需要优化的维度如此之多,因此我觉得有必要维护一个资源的持续列表。
组织结构为:基础 → 架构 → 行动表示 → 世界模型 → 学习范式 → 部署 → 应用。
欢迎贡献——特别是纠正和补充缺失的论文。
我们将在5月2日在旧金山举办一场创始人拳击赛。
这不是一次展览,也不是噱头。这是一场真正的拳击比赛,经过真实的训练,具有真正的风险,并且会有观众。
我们正在寻找那些希望接受严峻挑战并愿意从2月8日开始认真训练的创始人。拳击是无情的,你会很快被谦卑。这正是目的所在。
为什么要参加这个活动?
大多数创始人都缺少一些纯粹的、令人恐惧的、二元的体验:你要么准备好出场,要么就不行。没有演示文稿,没有花言巧语。
活动详情:
– 旧金山/湾区的创始人
– 在The Park Gym的结构化训练计划
– 匹配对手
– 5月2日的比赛之夜
– 名额有限
如果这听起来疯狂但又引人入胜,你可能就是合适的人选。
更多信息及申请:
theparkgym.com/foundersfight
在过去的几年里,我每个月稳定地提交15到30个拉取请求(PR)。<p>这几个月我开始更多地尝试使用人工智能,几乎在所有事情上都在使用它。那么到目前为止,1月份我提交了多少个PR?4个。即使在过去我经历过低谷,也没有表现得这么糟糕。<p>我觉得之前我很享受这个过程,而现在却没有了。现在我还得审核人工智能生成的PR,这让我觉得这不再是成年人该做的认真工作,感觉有些精神疲惫。<p>你的统计数据怎么样?