从它们的口中传出文字转WAV音频