因为他们很明确地知道文字转WAV音频