他就会根据对方说话的口吻和语气进行勾勒文字转WAV音频