这里相当于由他的记忆构成文字转WAV音频