so-vits-svc的使用声音克隆

张

张建站

2026/4/8 4:28:31

10分钟阅读

前言通过学习模型对声音进行克隆共经历两大步一步是训练一步是推理即声音模拟1. 启动工程找到工程的路径找到启动的bat文件这里以 d:/so-vits-svc为例。2. 启动过程启动后会出现cmp的一个弹框初始启动相对较慢请耐心等待一会儿启动完成后会出现一个页面如下图注意如cmp弹框运行10分钟后还没有弹出浏览器页面则需要重启服务器。3.操作步骤3.1 在d:/so-vits-svc/dataset_raw/ 目录下创建一个新文件夹该文件夹的命名就是后续使用的数据集名称再把音频文件放到此新建文件夹的下。注意删除 d:/so-vits-svc/dataset_raw/ 目录下其他的文件夹同时也有删除 d:/so-vits-svc/dataset/ 目录下的所有文件夹如需备份上一次训练的结果需要备份的目录有三个分别是dataset_raw、dataset、configs3.2 点击识别数据集按钮出现数据集的名称。3.3 再点击数据预处理按钮数据预处理完同时在目录 d:/so-vits-svc/dataset/44k/新文件夹下出现对应的4个文件一个音频对应4个文件如下图3.4 配置文件如果配置没有问题的话点击写入配置文件按钮。3.5 最好点击从头开始训练按钮就可以了这时候会出现cmp弹框如果不小心把这个cmp弹框给关闭的话可以再点击页面的继续上一次的训练进度按钮就能恢复。训练过程如下训练的时长取决于总的音频时长1小时的音频时长大约需要23小时。cmp窗口执行完成后再d:/so-vits-svc/logs/44k/目录下出现两个文件D_19200.pth和G_19200.pth ,这个名字就是后面推理中模型选择的名字。3.6 训练完成以后再点击训练聚类模型这时候会在新的终端窗口开始训练训练聚类模型不会输出日志检查任务管理器中python进程有在占用CPU就是正在训练训练一般需要5-10分钟左右训练完成后会在d:/so-vits-svc/logs/44k/目录下生成 kmeans_10000.pt 文件对应推理中“选择聚类模型”到这里训练步骤就完成了。4. 推理即声音模拟4.1 模型选择、配置文件、选择聚类模型模型选择选择最后一个就行配置文件选择config_json 注就一个选择聚类模型选择 kmeans_10000.pt 注就一个4.2 上传克隆的声音4.3 声调的选择常规选择-2可根据克隆声音的效果进行调整一般调整范围是-2 到 -44.4 点上4.5 点击加载模型4.6 最后再点击最下面的转换按钮参考资料如下视频地址https://www.bilibili.com/video/BV15V4y1Z7YB/?spm_id_frompageDrivervd_sourceb0970c1f6df729f0d191a610486b9dff声明该技术纯用于技术交流

基于VSCode搭建开源嵌入式环境的make构建工具选择

NOTE：此篇文章由笔者的 VSCodearm-none-eabi-gcc交叉编译Makefile构建OpenOCD（基于STM32标准库的保姆级教程）派生而来。 make构建工具即make.exe，和makefile脚本同步协作。makefile里面的语法规定了代码项目中多文件的编译顺序和编…...

2026/4/8 4:25:44 阅读更多 →

人工智能|大模型——模型——混合专家网络架构详解（MoE）！

随着GPT-4、DeepSeekMoE等模型的发布中均涉及到了混合专家模型（MoE，Mixture of Experts）的话题，MoE 模型已经成为开放 AI 社区的热门话题。2023年6月，美国知名骇客George Hotz在接受采访时透露，GPT-4由8个2…...

2026/4/8 4:24:50 阅读更多 →

Kubernetes 集群优化实战：面向 30+ 集群、万级 Pod 与高并发场景的生产级架构升级指南

Kubernetes 集群优化实战：面向 30+ 集群、万级 Pod 与高并发场景的生产级架构升级指南引言当 Kubernetes 集群数量从 1 个增长到 10 个、30 个甚至更多时，运维复杂度并不是线性上升，而是呈指数级放大。单集群时代的问题通常只是“资源不够”“监控不全”“发布不稳”；而…...

2026/4/8 4:24:45 阅读更多 →

ESP32硬件PWM控制库PWMOutESP32实战指南

1. PWMOutESP32 库深度解析：面向嵌入式工程师的 ESP32 PWM 控制实践指南 1.1 库定位与工程价值 PWMOutESP32 是一个专为 ESP32 系列微控制器设计的轻量级 PWM 输出控制库，其核心目标是提供 Arduino 风格的 pwm.analogWrite(pin, value) 接口&#xff…...

2026/4/5 0:05:17 阅读更多 →

AVR长周期看门狗库：突破8秒限制实现毫秒级精准复位与睡眠唤醒

1. LongerWatchDog 库概述：突破AVR看门狗定时器的固有约束在嵌入式系统开发中，看门狗定时器（Watchdog Timer, WDT）是保障系统可靠性的关键机制。传统Arduino平台（尤其是基于ATmega328P、ATmega2560等AVR架构的板卡&…...

2026/4/5 0:08:58 阅读更多 →

LeetCode 92. Reverse Linked List II 题解

LeetCode 92. Reverse Linked List II 题解题目描述给你单链表的头指针 head 和两个整数 left 和 right ，其中 left < right 。请你反转从位置 left 到位置 right 的链表节点，返回反转后的链表。示例 1： 输入：head [1,2,…...

2026/4/5 0:10:47 阅读更多 →