所以大多只是以文字的形式呈现文字转WAV音频