所以他才会记住文字转WAV音频