WaveGrad
WaveGrad是Google Br
ain的人员设计的一种快速,高质量的神经声码器。 描述了该体系结构。 简而言之,该模型采用对数比例的梅尔频谱图,并通过迭代精化将其转换为波形。
状态(2020-10-15)
稳定训练(22 kHz,24 kHz)
高质量合成
混合精度训练
多GPU训练
自定义噪声时间表(更快的推断)
命令行推断
程序推理API
PyPI包
音频样本
预训练模型
预先计算的噪声时间表
音频样本
预训练模型
(183 MB,SHA256: 65e9366da318d58d60d2c78416559351ad16971de906e53b415836c068e335f3 )
安装
使用pip安装:
pip install wavegrad
或从GitHub: