CosyVoice 3.0 v1.2.7

3秒录音,克隆你的声音

基于FunAudioLLM的AI语音克隆工具,只需3-10秒人声录音即可克隆音色,支持跨语种复刻、自然语言控制和语音转换。本地运行,数据不上传云端,隐私安全有保障。

核心功能

mic

声音克隆

3-10秒录音即可克隆音色,生成自然逼真的语音

globe

跨语种复刻

中文声音说英文、日文,跨语言语音合成

message

自然语言控制

用文字描述控制方言、情感、语速等效果

swap

语音转换

将一段录音的音色替换为另一个人的声音

下载

程序本体 5.96 GB
即将开放
AI模型 5.46 GB
即将开放

⚠ 所有包都需下载,解压到同一英文路径

安装步骤

1

下载两个压缩包到同一目录

2

用7-Zip解压到英文路径(如D:\CosyVoice3)

3

双击FirstRun.bat完成首次设置

4

注册账号登录即可使用

系统要求

操作系统Windows 10/11(64位)
内存8GB以上推荐
磁盘空间约20GB可用空间
显卡NVIDIA显卡推荐(无显卡也可CPU运行)