就是因为他们的核心成员文字转WAV音频