要采集到详尽的数据是不容易文字转WAV音频