而后细细锁定那边的两人文字转WAV音频