他们会保持中立文字转WAV音频