而且他们的表情还在不断地切换文字转WAV音频