在抽取记忆前文字转WAV音频