开源推荐
morning
GitHub 热门项目:话匣子
2026-05-27
1 阅读
GitHub Trending
GitHub 项目:话匣子
仓库地址:https://github.com/resemble-ai/chatterbox
星级:24872 | 作者:resemble-ai
项目描述:SoTA开源TTS
===================================================
自述文件内容:

# 话匣子 TTS
[](https://resemble-ai.github.io/chatterbox_turbo_demopage/)
[](https://huggingface.co/spaces/ResembleAI/chatterbox-turbo-demo)
[](https://podonos.com/resembleai/chatterbox)
[](https://discord.gg/rJq9cRJBJ6)
*由♥️制作*
**Chatterbox** 是 Resemble AI 提供的三个最先进的开源文本转语音模型系列。
我们很高兴推出**Chatterbox-Turbo**,这是我们迄今为止最高效的模型。 **Turbo** 基于简化的 350M 参数架构而构建,与我们之前的型号相比,**Turbo** 使用更少的计算和 VRAM 提供高质量的语音。我们还提炼了语音令牌到梅尔解码器(以前是一个瓶颈),将生成步骤从 10 个步骤减少到只有 **一个**,同时保留高保真音频输出。
**副语言标签**现在是 Turbo 模型的原生标签,允许您使用“[咳嗽]”、“[笑]”、“[笑]”等来添加独特的真实感。虽然 Turbo 主要是为低延迟语音代理而构建的,但它在旁白和创意工作流程方面表现出色。
如果您喜欢该模型,但需要对其进行缩放或调整以获得更高的准确度,请查看我们价格具有竞争力的 TTS 服务(链接)。它提供可靠的性能和低于 200 毫秒的超低延迟,非常适合代理、应用程序或交互式媒体的生产使用。
### ⚡ 模型动物园
为您的应用选择正确的型号。
|型号|尺寸|语言 |主要特点|最适合 | ? |示例 |
|:--------------------------------------------------------------------------------------------------------------------------------| :--- | :--- |:--------------------------------------------------------|:------------------------------------------------------------------------|:----------------------------------------------------------------------------------------| :--- |
| **话匣子涡轮** | **350M** | **英语** |副语言标签(`[笑]`),较低的计算和 VRAM |零镜头语音代理,制作 | [
### ⚡ 模型动物园
为您的应用选择正确的型号。
|型号|尺寸|语言 |主要特点|最适合 | ? |示例 |
|:--------------------------------------------------------------------------------------------------------------------------------| :--- | :--- |:--------------------------------------------------------|:------------------------------------------------------------------------|:----------------------------------------------------------------------------------------| :--- |
| **话匣子涡轮** | **350M** | **英语** |副语言标签(`[笑]`),较低的计算和 VRAM |零镜头语音代理,制作 | [