melotts中英文模型使用

X-Elite 平台 MeloTTS 使用指南 - 开发者文档

简介

本文档旨在为开发者提供在 X-Elite 平台上使用 MeloTTS 生成高质量中英文音频的详细操作指南。文档涵盖了从 Python 环境准备、模型下载与配置,到环境依赖安装及最终的推理测试的完整流程。

1. 安装 Python 3.12 AMD 版本

在 X-Elite 平台上运行 MeloTTS 前,首先需要安装兼容的 Python 环境。请确保下载并安装 Python 3.12 的 AMD64 (Windows x86-64) 版本。

提示: 安装 Python 时,请务必勾选 Add Python to PATH 选项,以便在命令行中能够直接调用 Python 及 pip 命令。

2. 下载模型

骁龙 X Elite-8380

获取 MeloTTS 模型文件后,请先将压缩包解压到您指定的本地工作目录。解压完成后,打开命令提示符(CMD)或 PowerShell,并使用 cd 命令切换到该模型目录下。

cd /d 您的模型解压目录路径

3. 安装环境并验证

3.1 安装环境

在已进入的模型目录中,请依次运行以下命令来安装 MeloTTS 及其相关依赖包。这里包括了官方的 GitHub 仓库、基础环境要求以及针对 QNN 加速所需要的特定构建轮子(WHL 文件)。

pip install --no-deps git+https://github.com/myshell-ai/MeloTTS.git
pip install -r requirements.txt
pip install qai_appbuilder-2.42.0.73-cp312-cp312-win_amd64.whl

3.2 进行测试

环境配置完成后,您可以通过运行以下命令来验证模型是否正常工作,支持生成中文和英文的音频文件。

生成中文音频:

python melotts_zh_qnn.py
python melotts_zh_qnn.py --text "你好世界"
python melotts_zh_qnn.py --text "今天天气真好。" --output my_audio.wav

生成英文音频:

python melotts_en_qnn.py
python melotts_en_qnn.py --text "Hello world"
python melotts_en_qnn.py --text "This is a test." --output my_audio.wav