所以他们三个已经决定了文字转WAV音频