因为他们的目标非常的明确文字转WAV音频