本次使用的是UP主数列解析几何一生之敌的webui一键包
自动标注使用的是UP主领航员未鸟的自动标注一键包 并添加了第一个DLC
一、本地配置说明
使用的CPU是I5-13600KF 内存32GB 显卡是4070ti 显存12GB
系统版本 Win11 专业工作站版 22H2
二、准备数据集文件
这次使用的数据集是我自己录的干声总时长两小时左右,用Slicer-gui的默认配置切成了每7s一个wav文件
slicer-gui默认配置
并用领航员未鸟自动标注包中的重命名bat文件将它们的文件名改好
976个wav文件,每个长度7s
依次运行自动标注包中的 1.开始标注.bat 和 2.清理用于Bert_VITS2的标注.bat
结果如图
1.开始标注.bat
2.清理用于Bert_VITS2的标注.bat
处理完的.list文件如下
barbara.list
clean_barbara.list
将处理后的976个wav文件复制到webui一键包自动生成的Datasxdcustom_character_voice中
将生成的标注文件 barbara.list改名成short_character_anno.list
clean_barbara.list改名成cleaned.list
以对应config.yml文件中的配置
config.yml中preprocess_text.py的配置
处理结果如下
文件从自动标注一键包改名并复制至bert-vits2 webui一键包中
将cleaned.list和short_character_anno.list中的wav路径改成正确的路径
原本的文件路径
修改后的文件路径
至此 对数据集的处理和标注 结束
二、进入webui开始训练前的处理
直接点击 2.文本预处理 未出现报错
文本预处理
再点击3.生成bert文件 成功生成974个.pt文件 未出现报错
生成bert文件
三、开始训练
使用默认配置 点击写入配置
默认配置没有改动
点击4a.首次训练 发生报错
五、其他错误
使用slicer-gui将原音频文件切分成7s的小段并放进custom_character_voice文件夹后,使用webui一键包后 点击 1.a.数据集重采样和标注(使用whisper)
venvpython.exe short_audio_transcribe.py --languages CJE --whisper_size medium
whisper模型选择medium 语言选择CJE三语
出现如下报错
报错
报错说没有找到短音频文件,但是我的确已经切分并将文件放到了对应的位置 有点搞不明白
希望有大佬帮助解答
到此这篇预训练权重下载(训练不用预训练权重)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/bcyy/50856.html