这里要尽可能的提高效率和分数文字转WAV音频