其次是观察他的状态文字转WAV音频