你可以把我们看成一个整体文字转WAV音频