因此他们所学的主要根源的那一部份的文字转WAV音频