1作者: mrqjr13 天前原帖
我花了一年的时间来解决一个真实的问题:AI翻译的字幕不一致——在正式和非正式之间切换,角色名称在影片中途发生变化,语气随机跳跃。 现有的工具将字幕视为孤立的句子。因此,我构建了一个*多代理系统*,它的工作方式类似于一个真实的翻译团队:“导演”创建整个影片的风格指南,“术语代理”确保术语的一致性,而“翻译者”则利用上下文窗口进行翻译。 这个系统运作良好。我已经用它处理了数百小时的字幕,质量超过了我尝试过的大多数SaaS产品。 老实说,我最初是想构建一个SaaS产品。但让产品被人注意到是很困难的——营销、客户获取、支持。作为一个独立开发者,我没有大公司或风险投资的资源。 与其让这个项目在我的硬盘上沉寂,不如将其开源,让需要的人可以自己部署。至少这样,我花费的时间没有浪费,并且可以帮助一些人。 三个专业代理按顺序工作: 1. 导演代理 - 阅读整个字幕文件并生成风格指南(语气、正式程度、称呼策略)。使用长上下文模型分析完整剧本。 2. 术语代理 - 提取并确保术语的一致性:角色名称(带性别推断的代词)、地点、领域术语。输出可嵌入提示中的Markdown术语表。 3. 翻译者代理 - 使用双向上下文的滑动窗口: - 参考之前的翻译(以保持连贯性) - 预览即将到来的句子(以避免拆分错误) - 严格的格式验证(保持时间、ID、结构) - 批处理以提高效率 4-6. 审核、润色和时间调整代理计划在2026年第一季度推出。 技术栈: - .NET 10.0 + Microsoft Agents框架 - Subtitle Edit (libse) 用于解析 - 多种字幕格式(自动检测) - 紧凑格式以减少令牌使用 - 可配置的LLM端点(兼容OpenAI、Gemini等) - 模型策略:导演/术语使用长上下文,翻译则采用成本效益高的策略 状态: [Y]核心管道(步骤1-3)已准备好投入生产并开源 [Y]单语翻译功能正常 [Y]支持双语字幕 步骤4-6预计在2026年第二季度之前完成 计划在2026年5月推出Windows/macOS/Web用户界面
1作者: causalzap13 天前原帖
嗨,HN, 我为游戏《Where Winds Meet》建立了这个数据库,因为现有的维基网站速度太慢且负担过重。 这个数据库是使用Astro和Tailwind构建的,专注于性能和静态网站生成。它支持5种语言(使用基于JSON的国际化),并通过在内容页面上不使用任何客户端JavaScript,实现了完美的Lighthouse评分。 该项目是开源的:[在此插入GitHub链接] 技术栈: - Astro(静态网站生成) - TypeScript - 使用JSON进行数据存储(无数据库) 欢迎对结构或性能提出任何反馈!
1作者: credentum13 天前原帖
构建能够花费资金的代理(通过AP2/支付API)。监管机构希望有审计轨迹。代理使用来自多个供应商的工具。 问题:没有统一的方法来证明代理做出决策的<i>原因</i>。每个供应商记录他们的部分,但完整的决策链是碎片化的。 有人解决过这个问题吗?特别感兴趣的是: - 跨供应商的决策来源 - 记录什么(交易链?上下文?仅仅是行动?) - 存储(集中式数据库 vs. 不可变账本)