或者是口角什么的文字转WAV音频