而是从外面捕捉过来文字转WAV音频