而是全神贯注地观察文字转WAV音频