所以他很少纠结文字转WAV音频