他们还专门多观察了一段时间文字转WAV音频