他们针对的自然是人族文字转WAV音频