虽然大多数观众都表示文字转WAV音频