他们理应在第一批上场文字转WAV音频