也许不会遵循旧例的文字转WAV音频