这样的方案到底是不是具有可文字转WAV音频