因为太仿真太现实了文字转WAV音频