只在它们同时存在着时文字转WAV音频