来统计出他们的大致人数文字转WAV音频