这个是他们能力的一种体现文字转WAV音频