最后往后退了几步才稳定下身形文字转WAV音频