要在几百人中快速的锁定一个熟人文字转WAV音频