但最终的解决方案却和文字转WAV音频