如果有人注意看的话就可以发现其实他的动作一直在重复文字转WAV音频