我们要做的就是不动声色地跟着他们文字转WAV音频