情感与可控 TTS

使用 CosyVoice 的情感文本转语音

让你的文本听起来像真人。CosyVoice 能生成五种情感的富有表现力的语音,并遵循自然语言指令控制风格、方言、语速、重音与呼吸。

输入文本

0/120

每次生成限 120 字符。可用:120 字符。

选择声音

晓悦 · 普通话
普通话
晓悦 · 普通话

温暖自然的女声,适合配音、有声书与客服播报。

晨煦 · 普通话
普通话
晨煦 · 普通话

沉稳清晰的男声,适合新闻播报、讲解与教程旁白。

阿乐 · 粤语
粤语
阿乐 · 粤语

地道粤语男声,适合粤语配音、短视频与影视解说。

幺妹 · 四川话
四川话
幺妹 · 四川话

亲切的四川话女声,适合方言短视频与趣味配音。

阿宝 · 上海话
上海话
阿宝 · 上海话

软糯的上海话嗓音,适合本地生活与情感叙事内容。

津味 · 天津话
天津话
津味 · 天津话

诙谐的天津话男声,适合相声风格与喜剧配音。

富有表现力、可控的语音

五种核心情感

以开心、悲伤、愤怒、恐惧或惊讶的语气朗读文本,支持中英文。

指令控制

用「慢一点、温柔地说」或「听起来兴奋些」这样的自然语言提示来引导表达。

细粒度标记

在词级别插入呼吸、添加重音并调整语速,实现精准指挥。

一致的身份

在每种情感、风格与语速下保持同一说话人身份。

情感 TTS 的用武之地

游戏与角色

为 NPC 和角色配上与场景相符的情感语音。

视频与社交内容

加入生动的旁白,牢牢抓住观众注意力。

对话式 AI

为助手赋予富有同理心、感知情境的语气。

有声书与广播剧

用可信的情感张力演绎对白。

情感语音合成常见问题

CosyVoice 支持哪些情感?

CosyVoice 可生成开心、悲伤、愤怒、恐惧与惊讶的语音,以及中性表达,支持中文和英语。

如何控制情感与风格?

用自然语言指令引导 CosyVoice — 例如「用欢快的语气说」— 或使用细粒度标记控制重音、停顿与语速。

可以控制语速和重音吗?

可以。CosyVoice 支持快慢语速控制,以及词级别的重音与呼吸标记,实现精准表达。

情感文本转语音可以免费试用吗?

可以。在上方演练场试用富有表现力的合成。CosyVoice 基于 Apache-2.0 开源,可自行部署。