根据外貌数据库的识别匹配文字转WAV音频