我们说的是修补文字转WAV音频