只是这类系统多用于一两个人的特殊行动文字转WAV音频