当支持度高到一定程度时文字转WAV音频