一般都是通过一种特殊的器物文字转WAV音频