此时他可以开口认亲文字转WAV音频