他们从哈桑中弹和听到枪声的时间差上就能判断出文字转WAV音频