返回首页
最新
CharacterAI 拥有超过 2000 万活跃用户,允许人们与 AI 语音克隆进行对话。我构建了一个本地替代方案,可以通过少于 10 秒的音频克隆任何声音,并且能够流利地使用超过 10 种语言进行对话,且可在您的 Macbook 或 Mac mini 上本地运行。
目前,该语音处理管道支持任何 M1 到 M5 芯片上的 MLX。我使用了 Whisper-Turbo 进行语音转文本(STT),Qwen3.5-9B-4bit 作为大语言模型(LLM),以及 Qwen3-TTS-0.6B-4bit 进行文本转语音(TTS)。
该代码库还具有 Websocket 传输功能,可以通过安全的 Websocket 将这些语音添加到由 ESP32 驱动的设备上。
我们是两名工程师,对频繁切换上下文感到厌倦。为什么我们需要执行 git push,打开浏览器标签,等待某个任务真正开始,咬指甲(或浏览 HackerNews)长达十分钟或更久,期间依赖项被安装了第100次,最后却遇到无效的 YAML 错误。而且,这种情况通常发生在管道的最后阶段,导致不可避免的 git 提交“修复”、“再次修复”、“测试”、“这次真的修复了”。我们可以做得更好。
于是,我们开始构建 Zippy。一个可以在终端中工作的 CI/CD 系统。没有上下文切换,没有缓慢的容器,提供即时反馈和无缝的 Claude Code 集成。只需 git push,立即构建,然后继续前进。两个 bash 脚本,一个用于设置(缓存的)环境,一个用于运行构建过程。