和我本身的记忆进行融合文字转WAV音频