提出的条件也算合理文字转WAV音频