1作者: Intragalactic4 天前原帖
嗨,HN,我们参加了YC W26批次,开发了Approxima,一个能够跟踪用户旅程并进行验证的网络代理。今天,我们将其开源(MIT许可证),并且完全可以自我托管。 以下是我们平台的一些酷炫功能: 探索模式:您无需自己指定用户旅程的步骤,只需给代理提供一两句描述其外观的句子,代理就能自行确定步骤,以便将来能够跟随这些步骤。 A/B测试:您可以调整网络代理的系统提示,并在平台内部进行A/B测试。 自我修复:旅程的步骤会随着时间的推移而更新,以与您产品的演变保持一致。因此,理想情况下,随着时间的推移,代理所需的时间和令牌数量会逐渐减少,因为它需要做出的决策和思考会减少。
3作者: AG3424 天前原帖
我是Trace的开发者,这是一款非侵入式、快捷键驱动的Mac应用程序,可以在设备上录制和转录会议。我知道,又是一款会议转录应用。但请耐心听我说,我相信这款应用至少有一些新意。 我主要是为自己开发Trace。我之前使用MacWhisper,但在每次通话前需要进行很多设置,常常忘记启动,结果在一个小时的会议中什么都没记录下来。因此,我最关心的是它能快速激活,并且不会干扰我的工作。你可以通过按下一个全局快捷键(可配置)来激活Trace,这会在屏幕底部显示一个小工具条(如果你不想看到它,还有一个按键和/或选项可以完全隐藏它)。 在开发过程中,我想加入一些我在其他转录应用中希望拥有的工作流程。 1. 在会议进行中,你可以按下另一个全局快捷键来标记一个“关键时刻”,并输入备注。备注会在生成的转录文本中以时间戳的形式显示。我想添加这个功能是因为我常常在会议中想到“等等,这个很重要”,然后去其他应用(比如Obsidian)记下来,这样就会让我暂时离开会议。我一直在使用这个功能。如果我在会后将转录文本粘贴到大型语言模型(LLM)中(我发现自己最近越来越常这样做),重要的时刻会被标记出来,以免被忽略。这在长时间的会议中,涉及多个主题时尤为明显。 2. 通过另一个快捷键,你可以快速召唤一个粗略的实时回顾(基本上是字幕),以快速回顾刚刚说过的内容。 Trace使用标准的macOS麦克风和系统录音API来捕捉对话的双方,将其作为两个独立的音轨录制,然后通过设备上的分段识别技术来识别说话者。目前我们只将其标记为“说话者1”、“说话者2”等,但未来计划会有更详细的说话者标记。你还可以在通话进行时显示“实时回顾”,以回顾某人刚刚说过的话。 所有转录模型都在你的设备上运行。需要明确的是,Trace并不进行任何总结,它只是生成一个Markdown格式的转录文本,因此如果你需要总结,就需要将输出传递给AI。 该应用程序是沙盒化的,你的音频和转录文本从未上传到任何地方——它们仅以音频文件和Markdown格式存在于磁盘上。Trace唯一需要进行的网络调用是在首次运行时,从Hugging Face下载语音和说话者模型(大约500MB),之后可以完全离线使用。如果启用,Google日历集成可以自动命名会议,但这需要网络连接。 该应用在macOS应用商店的售价为£9.99。我已经每天使用它几个月了,对它改善我的工作流程感到非常满意。欢迎反馈。
2作者: sermakarevich4 天前原帖
1. 无头模式 无头模式允许您将 AI 作为命令行工具用于自动化和脚本编写。在 Claude Code 中,您可以使用 -p 标志运行它:claude -p;在 Codex 中使用 exec;在 Opencode 中使用 run。 2. 请求人类 在无头模式下,传统的与操作员的通信渠道将无法使用——我们需要实现一个专用工具。以下是如何实现的示例:<a href="https://github.com/sermakarevich/claude/tree/main/mcp/ask_human" rel="nofollow">https://github.com/sermakarevich/claude/tree/main/mcp/ask_human</a> 3. 任务队列 Beads 是一个轻量级的分布式图形问题跟踪器,专为 AI 代理而设计,基于 Dolt。您可以创建任务,定义任务之间的依赖关系,并设置状态、优先级和层级。Beads 有助于防止多个任务被超过一个工作者认领。 4. 工作者工件 我们希望能够监控工作者的状态、当前阶段,并在重启后恢复任务。对于每个任务,我们可以使用 beads 任务 ID 创建一个专用文件夹,并将所需内容放入其中。我放入的内容包括: - 计划和状态 md - 知识 md - events.jsonl - stderr 工作者在其提示中被指示检查工件是否存在,这使其能够从任务中断的地方继续。 5. 工作者隔离 为了准备运行多个工作者,我们需要对其进行隔离。这里可以使用 Git worktree。我正在测试这种方法: - 工作者获取任务并实施 - 下一个自动生成的工作者验证任务是否完成,进行测试,合并工作树,关闭工单,并在需要时创建修复工单 6. 多个工作者 为了能够运行多个工作者,我们需要一个简单的调度器。一个无限循环不断检查 beads/config,并在需要时触发新的工作者。 7. 编码无关 工作者基本上可以是任何编码人员。我从 Claude 开始,添加了 Codex 和 Agy,最后添加了 Opencode。 8. 订阅限制 3 个编码代理可以在 30 分钟内消耗 Claude 的 $200 订阅限制,即使您切换到 Sonnet 4.6。API 令牌的成本是订阅令牌的 40 倍——这太贵了。我正在测试的想法是: - 使用最强大的模型进行分析/设计并添加任务 - 使用本地模型作为工作者 - 使用更强大的模型来验证工作者并添加新任务以修复潜在的错误实现 我正在使用 qwen3.6:36B 本地模型与 Ollama 部署在 2 张 GPU 卡上,总共 36GB,具有 256K 的上下文窗口。这虽然较慢,但是免费的。令人惊讶的是,它的效果比我预期的要好得多。Fable 5 在创建清晰简单的工单方面表现极佳。 我考虑的另一种方法是 Bedrock qwen,按令牌付费,或租用每月 $1400 的 96GB GPU。 我发现同时运行 3 个工作者是最佳选择,即使 Ollama 一次只处理 1 个请求。原因是 ask_human 工具。如果工作者在夜间问我问题——它必须等到早上才能继续。运行三个以上的工作者可以确保 GPU 负载达到 100%。 9. 良好的集成 用户界面 - 用于观察任务/beads/config/chat/analytics 当模型提出问题时,很容易错过。它在用户界面中可见——聊天旁边有一个绿色圆圈,但仅此而已。因此,我添加了 Telegram 集成——现在我可以在 Telegram 上接收工作者的问题并进行回复,获取任务状态,创建新任务等。 我这样做是为了我的概念验证项目: - 改善车队 - 构建与数据收集和分析相关的应用程序 我看到的是,24x7 的编码人员比我想象的更接近。即使是较弱的模型,在任务简单且定义明确时也能提供良好的结果。构建这些系统所需的所有组件都已具备。 代码库:<a href="https://github.com/sermakarevich/fleet" rel="nofollow">https://github.com/sermakarevich/fleet</a>