他们绝大多数都是平民文字转WAV音频