没有夸张的大幅度的肢体语言文字转WAV音频