那么大家就可以根据他的动作去推测文字转WAV音频