而是先行侦察文字转WAV音频