在人群的边角位置文字转WAV音频