他会用他觉得合适的办法去接近目标文字转WAV音频