他们采用某种类似文字转WAV音频