也肯定会逼着对方表态的文字转WAV音频