毕竟他同样能够感觉得出文字转WAV音频