CosyVoice 为文本到语音生成设立了新标准

以非凡的语音合成质量,全方位覆盖多语言和多场景应用。

输入文本

0/120

每次生成限 120 字符。可用:120 字符。

选择声音

晓悦 · 普通话
普通话
晓悦 · 普通话

温暖自然的女声,适合配音、有声书与客服播报。

晨煦 · 普通话
普通话
晨煦 · 普通话

沉稳清晰的男声,适合新闻播报、讲解与教程旁白。

阿乐 · 粤语
粤语
阿乐 · 粤语

地道粤语男声,适合粤语配音、短视频与影视解说。

幺妹 · 四川话
四川话
幺妹 · 四川话

亲切的四川话女声,适合方言短视频与趣味配音。

阿宝 · 上海话
上海话
阿宝 · 上海话

软糯的上海话嗓音,适合本地生活与情感叙事内容。

津味 · 天津话
天津话
津味 · 天津话

诙谐的天津话男声,适合相声风格与喜剧配音。

介绍

什么是 CosyVoice

探索一个由 CosyVoice 驱动的多语种语音生成世界。

多语言合成

支持中文、英语等多种语言及多种方言,覆盖广泛。

高速性能

快速响应的语音合成,延迟仅 150 毫秒,完美适配实时场景。

开源开放

基于 Apache-2.0 协议开源,便于灵活采用与扩展。

持续创新

CosyVoice 在文本转语音合成领域带来突破性的改进。

产品优势

CosyVoice 优势

CosyVoice 提供了多样化的语言支持和低延迟的实时实施,为各种语音合成需求提供了解决方案。

Multilingual speech synthesis

支持多语言

支持多种语言,包括普通话、英语和方言的语音合成。

Zero-shot voice cloning

零样本语音克隆

以极低延迟实时克隆声音,适用于交互式即时应用。

Low-latency synthesis

快速流式合成

采用 CosyVoice 低延迟流式合成,在实时应用中无缝生成语音。

关键数字

CosyVoice 实力

通过创新的双语语音模组,CosyVoice 为用户提供无与伦比的实时体验。

5+

覆盖语种

支持的全球语言

150ms

超低延迟

首包延迟(毫秒)

5.5

高 MOS 评分

语音自然度平均意见分

feature

CosyVoice 功能

CosyVoice 独特的功能提升您的语音合成体验。

多语言能力

CosyVoice 提供领先的多语言支持,轻松处理多种语言与方言。

低延迟性能

凭借极快的合成速度,CosyVoice 让应用在语音生成中几乎没有延迟。

零样本语音克隆

CosyVoice 采用零样本语音合成,轻松输出高精度语音。

常见问题

帮助中心

以下是关于 CosyVoice 使用和功能的常见问题解答。

应用场景

全方位多场景声音赋能

探索 CosyVoice 凭借高保真语音合成与零样本声音克隆,如何赋能不同场景的应用与创作需求。

有声书与播客配音

借助 CosyVoice 高拟真语音合成,一键生成情感丰富的有声书和播客内容。

CosyVoice有声书配音语音合成播客配音

视频自媒体创作

快速为短视频、影视解说生成多语言与粤语等18种方言配音,提升剪辑效率。

视频配音粤语配音软件广告配音

AI 智能客服与助理

150ms 超低延迟流式语音合成,实现虚拟助理的极速流利声音交互体验。

智能客服语音虚拟助手流式语音合成

游戏 NPC 与角色配音

支持开心、悲伤等多种情绪表达与原创声音设计,塑造栩栩如生的游戏角色。

游戏配音原创角色声音情绪语音合成

出海宣发与跨国翻译

支持中、英、日、韩等9种语言,实现跨语言声音克隆,保留音色完美出海。

跨语言声音克隆跨国配音多语言TTS

在线教育与语言学习

提供地道的双语教学声音样本,辅助多国语言学习,实现课件快速有声化。

在线教育配音语言学习TTS课件配音

马上体验

今天就开始使用 CosyVoice,体验无与伦比的语音合成技术。