根本不必像现在这般被动文字转WAV音频