其实是均匀地分布在身上的每一处的文字转WAV音频