虽然他们知道这个过程一旦承受下来文字转WAV音频