返回首页
最新
我花了一年的时间来解决一个真实的问题:AI翻译的字幕不一致——在正式和非正式之间切换,角色名称在影片中途发生变化,语气随机跳跃。
现有的工具将字幕视为孤立的句子。因此,我构建了一个*多代理系统*,它的工作方式类似于一个真实的翻译团队:“导演”创建整个影片的风格指南,“术语代理”确保术语的一致性,而“翻译者”则利用上下文窗口进行翻译。
这个系统运作良好。我已经用它处理了数百小时的字幕,质量超过了我尝试过的大多数SaaS产品。
老实说,我最初是想构建一个SaaS产品。但让产品被人注意到是很困难的——营销、客户获取、支持。作为一个独立开发者,我没有大公司或风险投资的资源。
与其让这个项目在我的硬盘上沉寂,不如将其开源,让需要的人可以自己部署。至少这样,我花费的时间没有浪费,并且可以帮助一些人。
三个专业代理按顺序工作:
1. 导演代理 - 阅读整个字幕文件并生成风格指南(语气、正式程度、称呼策略)。使用长上下文模型分析完整剧本。
2. 术语代理 - 提取并确保术语的一致性:角色名称(带性别推断的代词)、地点、领域术语。输出可嵌入提示中的Markdown术语表。
3. 翻译者代理 - 使用双向上下文的滑动窗口:
- 参考之前的翻译(以保持连贯性)
- 预览即将到来的句子(以避免拆分错误)
- 严格的格式验证(保持时间、ID、结构)
- 批处理以提高效率
4-6. 审核、润色和时间调整代理计划在2026年第一季度推出。
技术栈:
- .NET 10.0 + Microsoft Agents框架
- Subtitle Edit (libse) 用于解析
- 多种字幕格式(自动检测)
- 紧凑格式以减少令牌使用
- 可配置的LLM端点(兼容OpenAI、Gemini等)
- 模型策略:导演/术语使用长上下文,翻译则采用成本效益高的策略
状态:
[Y]核心管道(步骤1-3)已准备好投入生产并开源
[Y]单语翻译功能正常
[Y]支持双语字幕
步骤4-6预计在2026年第二季度之前完成
计划在2026年5月推出Windows/macOS/Web用户界面
嗨,HN,
我为游戏《Where Winds Meet》建立了这个数据库,因为现有的维基网站速度太慢且负担过重。
这个数据库是使用Astro和Tailwind构建的,专注于性能和静态网站生成。它支持5种语言(使用基于JSON的国际化),并通过在内容页面上不使用任何客户端JavaScript,实现了完美的Lighthouse评分。
该项目是开源的:[在此插入GitHub链接]
技术栈:
- Astro(静态网站生成)
- TypeScript
- 使用JSON进行数据存储(无数据库)
欢迎对结构或性能提出任何反馈!
构建能够花费资金的代理(通过AP2/支付API)。监管机构希望有审计轨迹。代理使用来自多个供应商的工具。
问题:没有统一的方法来证明代理做出决策的<i>原因</i>。每个供应商记录他们的部分,但完整的决策链是碎片化的。
有人解决过这个问题吗?特别感兴趣的是:
- 跨供应商的决策来源
- 记录什么(交易链?上下文?仅仅是行动?)
- 存储(集中式数据库 vs. 不可变账本)