
AI 始创公司 Resemble AI 宣布开源文本到语音模型 “Chatterbox Turbo”,仅需 5 秒音频即可克隆人声。
该公司称,该模型在音质上优于 ElevenLabs 与 Cartesia,且首段音频输出延迟低于 150 毫秒,实用于及时智能体、客服体系、游戏、虚拟形象及社交平台等场景。

Chatterbox Turbo 采取 MIT 许可证宣布,支撑免费商用、修改与再分发。模型已在 Hugging Face、RunPod、Modal、Replicate 和 Fal 上线,完全代码托管于 GitHub。
https://huggingface.co/ResembleAI/chatterbox-turbo
https://github.com/resemble-ai/chatterbox
Resemble AI 同时供给托管办事,并筹划推出低延迟版本。模型内置 “PerTh” 水印,便于监管行业验证语音是否由 AI 生成。

发表评论 取消回复