预训练权重下载（训练不用预训练权重）

编程语言来源：网络编辑：小编更新时间：2026-05-07 21:09:07 浏览量：1

本次使用的是UP主数列解析几何一生之敌的webui一键包

自动标注使用的是UP主领航员未鸟的自动标注一键包 并添加了第一个DLC

一、本地配置说明

使用的CPU是I5-13600KF 内存32GB 显卡是4070ti 显存12GB

系统版本 Win11 专业工作站版 22H2

二、准备数据集文件

这次使用的数据集是我自己录的干声总时长两小时左右，用Slicer-gui的默认配置切成了每7s一个wav文件

slicer-gui默认配置

并用领航员未鸟自动标注包中的重命名bat文件将它们的文件名改好

976个wav文件，每个长度7s

依次运行自动标注包中的 1.开始标注.bat 和 2.清理用于Bert_VITS2的标注.bat

结果如图

1.开始标注.bat

2.清理用于Bert_VITS2的标注.bat

处理完的.list文件如下

barbara.list

clean_barbara.list

将处理后的976个wav文件复制到webui一键包自动生成的Datasxdcustom_character_voice中

将生成的标注文件 barbara.list改名成short_character_anno.list

clean_barbara.list改名成cleaned.list

以对应config.yml文件中的配置

config.yml中preprocess_text.py的配置

处理结果如下

文件从自动标注一键包改名并复制至bert-vits2 webui一键包中

将cleaned.list和short_character_anno.list中的wav路径改成正确的路径

原本的文件路径

修改后的文件路径

至此对数据集的处理和标注结束

二、进入webui开始训练前的处理

直接点击 2.文本预处理未出现报错

文本预处理

再点击3.生成bert文件成功生成974个.pt文件未出现报错

生成bert文件

三、开始训练

使用默认配置点击写入配置

默认配置没有改动

点击4a.首次训练发生报错

五、其他错误

使用slicer-gui将原音频文件切分成7s的小段并放进custom_character_voice文件夹后，使用webui一键包后点击 1.a.数据集重采样和标注(使用whisper)

venvpython.exe short_audio_transcribe.py --languages CJE --whisper_size medium

whisper模型选择medium 语言选择CJE三语

出现如下报错

报错

报错说没有找到短音频文件，但是我的确已经切分并将文件放到了对应的位置有点搞不明白

希望有大佬帮助解答

到此这篇预训练权重下载（训练不用预训练权重）的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章，希望大家都能在编程的领域有一番成就！

上一篇： nvme是ssd吗（nvme是固态还是机械）

下一篇：文档打开目录（文档打开目录怎么设置）

版权声明：
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符，请将相关资料发送至xkadmin@xkablog.com进行投诉反馈，一经查实，立即处理！

转载请注明出处，原文链接：https://www.xkablog.com/bcyy/50856.html

相关文章：