情感与可控 TTS
使用 CosyVoice 的情感文本转语音
让你的文本听起来像真人。CosyVoice 能生成五种情感的富有表现力的语音,并遵循自然语言指令控制风格、方言、语速、重音与呼吸。
富有表现力、可控的语音
五种核心情感
以开心、悲伤、愤怒、恐惧或惊讶的语气朗读文本,支持中英文。
指令控制
用「慢一点、温柔地说」或「听起来兴奋些」这样的自然语言提示来引导表达。
细粒度标记
在词级别插入呼吸、添加重音并调整语速,实现精准指挥。
一致的身份
在每种情感、风格与语速下保持同一说话人身份。
情感 TTS 的用武之地
游戏与角色
为 NPC 和角色配上与场景相符的情感语音。
视频与社交内容
加入生动的旁白,牢牢抓住观众注意力。
对话式 AI
为助手赋予富有同理心、感知情境的语气。
有声书与广播剧
用可信的情感张力演绎对白。
情感语音合成常见问题
CosyVoice 支持哪些情感?
CosyVoice 可生成开心、悲伤、愤怒、恐惧与惊讶的语音,以及中性表达,支持中文和英语。
如何控制情感与风格?
用自然语言指令引导 CosyVoice — 例如「用欢快的语气说」— 或使用细粒度标记控制重音、停顿与语速。
可以控制语速和重音吗?
可以。CosyVoice 支持快慢语速控制,以及词级别的重音与呼吸标记,实现精准表达。
情感文本转语音可以免费试用吗?
可以。在上方演练场试用富有表现力的合成。CosyVoice 基于 Apache-2.0 开源,可自行部署。