前言

东雪莲可以和间眠大佐切割,我认为东雪莲也可以和锤头鲨本鲨切割。

首先 我不是棺材板

其次,准备开始了。

先品鉴一段

再来一段日配

文字-语音(GPT-SoVITS)

1 配置环境

1.1 Conda

先拉取最新的仓库

$ git clone https://github.com/RVC-Boss/GPT-SoVITS/

然后创建一个conda环境 并且安装所需要的包

在安装之前你应该手动安装一下pytorch来避免一会自动安装的torch没有gpu用

去pytorch官网查看怎么使用pip 安装最新的pytorch即可

然后安装requirements.txt

$ pip install -r requirements.txt

之后大概率会报错到爽

原因是你没有安装cpp相关工具,所以jieba_fast等一系列库无法被编译,这有两个解决办法,一是直接下载.whl文件安装,或者直接下载vc,我推荐后者一劳永逸

Microsoft C++ 生成工具 - Visual Studio

请下载并安装这个,然后重新执行上述命令。

不出意外应该就装好了这一堆库了,但是还是不能用的。

因为装的pytorch大概率是没有cuda版本的,用cpu嗯算需要耗费非常多的时间与电费,所以需要卸载pytorch后

$ pip uninstall pytorch

去pytorch官网:PyTorch选择你的环境并且复制命令安装。

$ pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 
#just a example modlfile it by yourself

下一步就可以开始推理了

需要先训练模型

训练 文字-语音(GPT-SoVITS)模型

需要准备一些申必数据集

在启动网页UI之前,需要在config.py中修改本地端口,避免占用其他你正在用的端口。

之后直接启动webui.py

当然训练非常麻烦 我这里提供一个现成的申必模型(东雪莲)

推理 文字-语音(GPT-SoVITS)模型

把模型解压后应该就能在web上看到了,再选择一段参考音频与文字,推荐选择一段特别清晰的。

之后就能让ai莲莲说话了。

so-vits-svc 模型

这个是让东雪莲唱歌的(