就是由于资源的稀缺文字转WAV音频