在人群的最中央文字转WAV音频