似乎是在观察什么文字转WAV音频