当前位置:网站首页 > 编程语言 > 正文

预训练权重下载(训练不用预训练权重)



本次使用的是UP主数列解析几何一生之敌webui一键包

自动标注使用的是UP主领航员未鸟自动标注一键包 添加了第一个DLC

一、本地配置说明

使用的CPU是I5-13600KF 内存32GB 显卡是4070ti 显存12GB

系统版本 Win11 专业工作站版 22H2

二、准备数据集文件

        这次使用的数据集是我自己录的干声总时长两小时左右,用Slicer-gui的默认配置切成了每7s一个wav文件

slicer-gui默认配置

并用领航员未鸟自动标注包中的重命名bat文件将它们的文件名改好

976个wav文件,每个长度7s

依次运行自动标注包中的 1.开始标注.bat 和 2.清理用于Bert_VITS2的标注.bat

结果如图

1.开始标注.bat

2.清理用于Bert_VITS2的标注.bat

处理完的.list文件如下

barbara.list

clean_barbara.list

将处理后的976个wav文件复制到webui一键包自动生成的Datasxdcustom_character_voice中

将生成的标注文件 barbara.list改名成short_character_anno.list

                              clean_barbara.list改名成cleaned.list

                               以对应config.yml文件中的配置

config.yml中preprocess_text.py的配置

处理结果如下

文件从自动标注一键包改名并复制至bert-vits2 webui一键包中

将cleaned.list和short_character_anno.list中的wav路径改成正确的路径

原本的文件路径

修改后的文件路径

至此 对数据集的处理和标注 结束

二、进入webui开始训练前的处理

直接点击 2.文本预处理 未出现报错

文本预处理

再点击3.生成bert文件 成功生成974个.pt文件 未出现报错

生成bert文件

三、开始训练

使用默认配置 点击写入配置

默认配置没有改动

点击4a.首次训练 发生报错

五、其他错误

使用slicer-gui将原音频文件切分成7s的小段并放进custom_character_voice文件夹后,使用webui一键包后 点击 1.a.数据集重采样和标注(使用whisper)  

venvpython.exe short_audio_transcribe.py --languages CJE --whisper_size medium

whisper模型选择medium 语言选择CJE三语 

出现如下报错

报错

报错说没有找到短音频文件,但是我的确已经切分并将文件放到了对应的位置 有点搞不明白

希望有大佬帮助解答

到此这篇预训练权重下载(训练不用预训练权重)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • nvme是ssd吗(nvme是固态还是机械)2026-05-07 21:09:07
  • 发送验证码花钱吗(发送验证码需要收取短信费用吗)2026-05-07 21:09:07
  • 分层图是什么意思(分层图层是什么)2026-05-07 21:09:07
  • pdf怎么删除某一页面(pdf怎么删除某一页面wps)2026-05-07 21:09:07
  • oven怎么读(Oven怎么读英语)2026-05-07 21:09:07
  • 文档打开目录(文档打开目录怎么设置)2026-05-07 21:09:07
  • 天国拯救战斗系统真垃圾(天国拯救战斗系统真垃圾吗)2026-05-07 21:09:07
  • passa平台(pass平台是怎么实现的)2026-05-07 21:09:07
  • 打印机共享修复一条龙(打印机一点共享就报错)2026-05-07 21:09:07
  • spss27和26的哪个好用(spss22和spss26的区别)2026-05-07 21:09:07
  • 全屏图片