既然是记录容貌文字转WAV音频