而且就连刚才讲话的语气都是一般无二文字转WAV音频