情感与可控 TTS

使用 CosyVoice 的情感文本转语音

让你的文本听起来像真人。CosyVoice 能生成五种情感的富有表现力的语音，并遵循自然语言指令控制风格、方言、语速、重音与呼吸。

输入文本

Emotion markers

颜色即心情。划选文字涂上颜色，再点击「生成」听听看！

0/120

每次生成限 120 字符。可用：120 字符。

选择声音

普通话

晓悦 · 普通话

温暖自然的女声，适合配音、有声书与客服播报。

普通话

晨煦 · 普通话

沉稳清晰的男声，适合新闻播报、讲解与教程旁白。

粤语

阿乐 · 粤语

地道粤语男声，适合粤语配音、短视频与影视解说。

四川话

幺妹 · 四川话

亲切的四川话女声，适合方言短视频与趣味配音。

上海话

阿宝 · 上海话

软糯的上海话嗓音，适合本地生活与情感叙事内容。

天津话

津味 · 天津话

诙谐的天津话男声，适合相声风格与喜剧配音。

富有表现力、可控的语音

五种核心情感

以开心、悲伤、愤怒、恐惧或惊讶的语气朗读文本，支持中英文。

指令控制

用「慢一点、温柔地说」或「听起来兴奋些」这样的自然语言提示来引导表达。

细粒度标记

在词级别插入呼吸、添加重音并调整语速，实现精准指挥。

一致的身份

在每种情感、风格与语速下保持同一说话人身份。

情感 TTS 的用武之地

游戏与角色

为 NPC 和角色配上与场景相符的情感语音。

视频与社交内容

加入生动的旁白，牢牢抓住观众注意力。

对话式 AI

为助手赋予富有同理心、感知情境的语气。

有声书与广播剧

用可信的情感张力演绎对白。

情感语音合成常见问题

CosyVoice 支持哪些情感？

CosyVoice 可生成开心、悲伤、愤怒、恐惧与惊讶的语音，以及中性表达，支持中文和英语。

如何控制情感与风格？

用自然语言指令引导 CosyVoice — 例如「用欢快的语气说」— 或使用细粒度标记控制重音、停顿与语速。

可以控制语速和重音吗？

可以。CosyVoice 支持快慢语速控制，以及词级别的重音与呼吸标记，实现精准表达。

情感文本转语音可以免费试用吗？

可以。在上方演练场试用富有表现力的合成。CosyVoice 基于 Apache-2.0 开源，可自行部署。

探索更多 CosyVoice 工具

声音克隆粤语与方言多语言语音合成