最终将其忽略文字转WAV音频