事实上这只是例行考察文字转WAV音频