从某种程度上来讲只是一个代表文字转WAV音频