如果人数差不多的话文字转WAV音频