依照他们两个人的状况来分析文字转WAV音频