所以他按照传承记忆的要求文字转WAV音频