双方采用了几乎一模一样的方式文字转WAV音频