而是主动询问他文字转WAV音频