前言通过学习模型对声音进行克隆共经历两大步一步是训练一步是推理即声音模拟1. 启动工程找到工程的路径找到启动的bat文件这里以 d:/so-vits-svc为例。2. 启动过程启动后会出现cmp的一个弹框初始启动相对较慢请耐心等待一会儿启动完成后会出现一个页面如下图注意如cmp弹框运行10分钟后还没有弹出浏览器页面则需要重启服务器。3.操作步骤3.1 在d:/so-vits-svc/dataset_raw/ 目录下创建一个新文件夹该文件夹的命名就是后续使用的数据集名称 再把音频文件放到此新建文件夹的下。注意删除 d:/so-vits-svc/dataset_raw/ 目录下其他的文件夹同时也有删除 d:/so-vits-svc/dataset/ 目录下的所有文件夹如需备份上一次训练的结果需要备份的目录有三个分别是dataset_raw、dataset、configs3.2 点击 识别数据集 按钮出现数据集的名称。3.3 再点击 数据预处理按钮数据预处理完同时在目录 d:/so-vits-svc/dataset/44k/新文件夹 下出现对应的4个文件一个音频对应4个文件如下图3.4 配置文件如果配置没有问题的话点击 写入配置文件 按钮。3.5 最好点击 从头开始训练 按钮就可以了这时候会出现cmp弹框如果不小心把这个cmp弹框给关闭的话可以再点击页面的 继续上一次的训练进度 按钮就能恢复。训练过程如下训练的时长取决于总的音频时长1小时的音频时长大约需要23小时。cmp窗口执行完成后再d:/so-vits-svc/logs/44k/目录下出现两个文件D_19200.pth和G_19200.pth ,这个名字就是后面 推理 中模型选择的名字。3.6 训练完成以后再点击 训练聚类模型这时候会在新的终端窗口开始训练训练聚类模型不会输出日志检查任务管理器中python进程有在占用CPU就是正在训练训练一般需要5-10分钟左右训练完成后会在d:/so-vits-svc/logs/44k/目录下生成 kmeans_10000.pt 文件对应推理中“选择聚类模型”到这里训练步骤就完成了。4. 推理即声音模拟4.1 模型选择、配置文件、选择聚类模型模型选择选择最后一个就行配置文件选择config_json 注就一个选择聚类模型选择 kmeans_10000.pt 注就一个4.2 上传克隆的声音4.3 声调的选择 常规选择-2可根据克隆声音的效果进行调整一般调整范围是-2 到 -44.4 点上4.5 点击 加载模型4.6 最后 再 点击最下面的 转换 按钮参考资料如下视频地址https://www.bilibili.com/video/BV15V4y1Z7YB/?spm_id_frompageDrivervd_sourceb0970c1f6df729f0d191a610486b9dff声明该技术纯用于技术交流