其实也是一样的原理文字转WAV音频