比如较重的绿豆或者茶叶会聚集在一起文字转WAV音频