不过更加科学的说法文字转WAV音频