因为他已经听见熟悉的文字转WAV音频