然后他每挪移一次文字转WAV音频