他们目前仅有的办法就是文字转WAV音频