返回首页
最新
我们推出了图像到图像翻译API的第一个版本(v1),该API通过替换现有文本来翻译图像上的文字。
对于v1,它基本上是一个模型流程:
OCR识别当前文本 -> 生成掩膜 -> 擦除文本 -> 翻译文本 -> 使用嵌入比较找到相似字体 -> 将文本映射回图像。
v1更像是一个原型,已经超越了许多由谷歌、Azure等提供的类似服务。
我们正在开发v2,计划训练一个扩散模型来翻译图像上的文本。目前,我们已经为英语和中文建立了工作流程,现在正在为其他语言构建数据集。
我想尝试一下代理,所以我根据这篇博客文章写了一个用于解决合并冲突的代理:<a href="https://sketch.dev/blog/agent-loop" rel="nofollow">https://sketch.dev/blog/agent-loop</a>。我发现这个代理在我处理的一些拉取请求中效果相当不错,但我建议在虚拟机中运行,因为它只是本地执行 shell 命令。