说明咱们这边一定会有人被分到一组的文字转WAV音频