他一般都是随口敷衍的文字转WAV音频