DDSP-SVC 模型训练

前言

首先收集你想要的音色的音频数据，一般在1个小时左右就可以了，对于DDSP来说，10分钟也能玩，但数据越多、质量越高，最终效果越好。
训练单人模型一定要单音色的音频数据！比如有些声优配音，不同角色差别大就不能混一起训练了，不然练出来的模型一般不是混合了音色，而是交替出现，听起来就像部队点人数时不同人音色喊 1、2、3、4、5 一样
最好有显卡支持，靠CPU会慢非常多
需要提取为纯人声音频，可以用MSST分离出人声，如果有明显噪音的音频也可以用MSST处理；游戏语音一般不用，它本身比较纯净，经过分离和降噪反而可能削掉部分音频和音质。

启动流明，然后在插件中安装DDSP-SVC
回到主页，点击联合扩展-DDSP-SVC-训练模型:
右上角运行环境，点击选择DDSP目录:
然后在下方的Yaml配置信息中，选择配置文件，新训练模型的话可以点击自动复制创建:
然后来调一下参数：
- 训练集文件夹: 生成的训练数据的存放目录
- 测试集文件夹: 生成的测试数据存放目录
- 模型文件夹: 训练过程和最终生成的模型存放目录
- 硬件加速: 如果有N卡，可以选择cuda提高训练速度
- 工作数: 如果cpu和显卡都比较强，可以选择0提高速度
o
- 参数精度: 降低精度可提升速度，但也会略微降低质量
- 学习率: 和模型质量密切相关，没有基于其他模型，或是基于0步底模训练则选择默认0.0005即可，否则在选择底模时，流明会自动计算推荐
- 批数量: 调大可以提高训练速度，但会增加显存占用
- 最大训练轮次: 训练到该轮次时停止，建议往大了调，正常应当手动停止，等训练到这个轮次限制太多了