我注意到,AI项目并没有像网页应用那样的标准模板,因此我构建了一个。这个想法是一样的——提供你快速启动项目所需的一切。然而,与网页框架/CSS/数据库不同的是,这里是针对AI项目的工具:评估、合成数据生成、微调等。
Kiln是一个免费的开源工具,它将大多数AI项目所需的功能整合在一个包中:
- 评估系统:包括LLM作为评估者的评估、评估数据生成和人类基准
- 微调:连接多个微调提供者,如Fireworks、Together、OpenAI和Unsloth
- 合成数据生成:与评估和微调深度集成
- 模型路由:支持12个提供者,包括Ollama、OpenRouter等
- 基于Git的协作:项目设计为通过您自己的Git服务器进行同步
关键的洞察是,这些工具在集成时效果更佳。例如,合成数据生成器知道您是在为评估还是微调创建数据(这两者的数据需求非常不同),而评估可以自动测试不同的提示/模型/微调组合。
它完全在本地运行——您的项目数据保存在本地文件中,您控制自己的Git仓库。无需外部服务(不过如果需要,它可以与外部服务集成)。
主要项目GitHub链接:[https://github.com/Kiln-AI/Kiln](https://github.com/Kiln-AI/Kiln)
演示GitHub链接,我使用它构建了一个“自然语言到ffmpeg命令”的演示,包含评估、微调和合成数据(包括演示视频):[https://github.com/Kiln-AI/demos/blob/main/end_to_end_project_demo/](https://github.com/Kiln-AI/demos/blob/main/end_to_end_project_demo/)
返回首页
最新
嗨,HN,
我一直在开发一个名为 SocialKit 的副项目,这是一个简单的 API,用于从公共社交媒体帖子(YouTube、Shorts,未来会增加更多)中抓取结构化数据。
它是为开发者、无代码用户和希望从 YouTube 中提取摘要、转录、详细信息等内容的营销人员设计的。
我之前出售过两个副项目(LectureKit 和 CaptureKit),这是我最新的一次尝试,希望能构建一些有用且专注的东西。我非常欢迎任何反馈 :)
如果有任何问题,我很乐意回答,谢谢你们的关注!
乔纳森
嘿,黑客们,
我和我的联合创始人开发了一个AI机器人,它能够从电子邮件或Slack聊天中读取自然语言上下文,并追踪可用性链接(如Calendly、cal.com等),然后将对方的可用时间与您的可用时间进行比较,以找到最佳会议时间。它还可以起草电子邮件回复并重新安排会议。演示链接:<a href="https://www.youtube.com/watch?v=YAJBARVWf1w" rel="nofollow">https://www.youtube.com/watch?v=YAJBARVWf1w</a>
非常感谢您的反馈!
您好,
下个月,我们将为Claude订阅用户推出新的每周使用限制,这将影响不到5%的用户,基于当前的使用模式。
Claude Code,尤其是作为我们订阅套餐的一部分,经历了前所未有的增长。同时,我们发现了一些政策违规行为,如账户共享和转售访问权限,以及一些高级使用模式,如在后台24/7运行Claude,这些都影响了所有用户的系统容量。我们的新使用限制旨在解决这些问题,为所有用户提供更公平的体验。
变化内容:
从8月28日起,我们将在现有的每5小时使用限制基础上引入每周使用限制:
```
当前:每5小时重置的使用限制(无变化)
新:每7天重置的整体每周限制
新:每7天重置的Claude Opus 4每周限制
随着我们对开发者使用Claude Code的了解加深,我们可能会调整使用限制,以更好地服务我们的社区。
```
这对您意味着什么:
```
大多数用户不会注意到任何变化。每周限制旨在支持您项目中的典型日常使用。
大多数Max 20x用户可以在每周使用限制内预期获得240-480小时的Sonnet 4和24-40小时的Opus 4。对于拥有大型代码库或同时运行多个Claude Code实例的重度Opus用户,他们会更早达到限制。
如果您达到每周使用限制,您可以选择按标准API费率购买更多使用时间,以便继续工作而不受干扰。这完全是可选的。
您可以随时在设置中管理或取消您的订阅。
```
我们非常重视这些决定。我们致力于通过其他选项支持长期使用案例,但在此之前,每周限制将帮助我们为所有人维持可靠的服务。如有需要,Max 20x订阅用户可以按标准API费率购买额外的使用时间。
我们也意识到,在此期间,用户遇到了多个可靠性和性能问题。我们一直在努力尽快解决这些问题,并将在接下来的几天和几周内继续处理任何剩余的问题。
——Anthropic团队
你好,
下个月,我们将为Claude订阅用户引入新的每周使用限制,这将影响不到5%的用户,基于当前的使用模式。
Claude Code,尤其是作为我们订阅套餐的一部分,经历了前所未有的增长。同时,我们发现了一些政策违规行为,比如账户共享和转售访问权限,以及一些高级使用模式,例如在后台24/7运行Claude,这些都影响了系统的整体容量。我们的新使用限制旨在解决这些问题,并为所有用户提供更公平的体验。
变化内容:
从8月28日起,我们将引入每周使用限制,配合现有的每5小时重置的限制:
当前:每5小时重置的使用限制(无变化)
新:每7天重置的整体每周限制
新:每7天重置的Claude Opus 4每周限制
随着我们对开发者使用Claude Code方式的了解加深,我们可能会调整使用限制,以更好地服务我们的社区。
这对你意味着什么:
大多数用户不会注意到任何变化。每周限制旨在支持您项目中的典型日常使用。
大多数Max 5x用户可以在每周使用限制内预期获得140-280小时的Sonnet 4和15-35小时的Opus 4。对于拥有大型代码库或同时运行多个Claude Code实例的重度Opus用户,他们可能会更早达到限制。
您可以随时在设置中管理或取消您的订阅。
我们非常重视这些决定。我们承诺将通过其他选项支持长期使用案例,但在此之前,每周限制将帮助我们为所有人维护可靠的服务。
我们也意识到,在此期间,用户遇到了若干可靠性和性能问题。我们一直在尽快修复这些问题,并将在接下来的几天和几周内继续解决任何剩余问题。
——Anthropic团队
本周的Jason Lemkin/Replit事件让我思考我们在使用AI编码助手时所面临的根本问题。我们都见过演示——自然语言转化为可运行的代码、对话式调试、“只需描述你想要的”。但一旦投入生产环境,一切就会崩溃。
我一直看到的核心技术挑战包括:
- 大规模的上下文管理——这些系统在处理孤立任务时表现良好,但在复杂的多文件项目中却难以维持一致的状态。如何处理跨越数千行代码和数十个文件的上下文?
- 安全性与能力的权衡——更强大的工具可能造成更大的损害。Replit承诺不干扰生产环境,但仍然删除了一个数据库。如何构建真正有效的保护措施,而又不削弱工具的功能?
- 复杂系统的对话界面——自然语言是模糊的,而代码是精确的。我们是否在试图解决错误的界面问题?
- 生产差距——我测试过的每一个AI编码工具在演示中都表现得非常出色,但在真实的代码库、真实的数据和真实的边缘案例中却崩溃。为什么这个差距如此持久?
我真的很好奇——有没有人用那些在生产环境中真正可靠的工具构建AI应用?