等待合适的时机再做处理文字转WAV音频