结合最后的记忆文字转WAV音频