随后的第三位是凭借文字转WAV音频