所以他们能够注意到文字转WAV音频