所以最终才采取了这样的双重保障文字转WAV音频