然后就把解释变成了行动文字转WAV音频