所以这种劣势根本无法弥补文字转WAV音频