最后等到顶部小到一定程度的时候文字转WAV音频