GitHub 热门项目:话匣子

2026-05-27 1 阅读 GitHub Trending
GitHub 项目:话匣子 仓库地址:https://github.com/resemble-ai/chatterbox 星级:24872 | 作者:resemble-ai 项目描述:SoTA开源TTS =================================================== 自述文件内容: ![Chatterbox Turbo 图像](./Chatterbox-Turbo.jpg) # 话匣子 TTS [![替代文本](https://img.shields.io/badge/listen-demo_samples-blue)](https://resemble-ai.github.io/chatterbox_turbo_demopage/) [![替代文本](https://huggingface.co/datasets/huggingface/badges/resolve/main/open-in-hf-spaces-sm.svg)](https://huggingface.co/spaces/ResembleAI/chatterbox-turbo-demo) [![替代文本](https://static-public.podonos.com/badges/insight-on-pdns-sm-dark.svg)](https://podonos.com/resembleai/chatterbox) [![Discord](https://img.shields.io/discord/1377773249798344776?label=join%20discord&logo=discord&style=flat)](https://discord.gg/rJq9cRJBJ6) *由♥️制作* resemble-logo-horizontal **Chatterbox** 是 Resemble AI 提供的三个最先进的开源文本转语音模型系列。 我们很高兴推出**Chatterbox-Turbo**,这是我们迄今为止最高效的模型。 **Turbo** 基于简化的 350M 参数架构而构建,与我们之前的型号相比,**Turbo** 使用更少的计算和 VRAM 提供高质量的语音。我们还提炼了语音令牌到梅尔解码器(以前是一个瓶颈),将生成步骤从 10 个步骤减少到只有 **一个**,同时保留高保真音频输出。 **副语言标签**现在是 Turbo 模型的原生标签,允许您使用“[咳嗽]”、“[笑]”、“[笑]”等来添加独特的真实感。虽然 Turbo 主要是为低延迟语音代理而构建的,但它在旁白和创意工作流程方面表现出色。 如果您喜欢该模型,但需要对其进行缩放或调整以获得更高的准确度,请查看我们价格具有竞争力的 TTS 服务(链接)。它提供可靠的性能和低于 200 毫秒的超低延迟,非常适合代理、应用程序或交互式媒体的生产使用。 Podonos Turbo Eval ### ⚡ 模型动物园 为您的应用选择正确的型号。 |型号|尺寸|语言 |主要特点|最适合 | ? |示例 | |:--------------------------------------------------------------------------------------------------------------------------------| :--- | :--- |:--------------------------------------------------------|:------------------------------------------------------------------------|:----------------------------------------------------------------------------------------| :--- | | **话匣子涡轮** | **350M** | **英语** |副语言标签(`[笑]`),较低的计算和 VRAM |零镜头语音代理,制作 | [