Resemble AI 宣布开源语音合成模型 Chatterbox Turbo

342 阅读 0 评论 0 点赞

AI 始创公司 Resemble AI 宣布开源文本到语音模型 “Chatterbox Turbo”，仅需 5 秒音频即可克隆人声。

该公司称，该模型在音质上优于 ElevenLabs 与 Cartesia，且首段音频输出延迟低于 150 毫秒，实用于及时智能体、客服体系、游戏、虚拟形象及社交平台等场景。

Chatterbox Turbo 采取 MIT 许可证宣布，支撑免费商用、修改与再分发。模型已在 Hugging Face、RunPod、Modal、Replicate 和 Fal 上线，完全代码托管于 GitHub。

https://huggingface.co/ResembleAI/chatterbox-turbo
https://github.com/resemble-ai/chatterbox

Resemble AI 同时供给托管办事，并筹划推出低延迟版本。模型内置 “PerTh” 水印，便于监管行业验证语音是否由 AI 生成。

点赞(0) 打赏

暂无评论