不可否认他确实很像文字转WAV音频