Saltar al contenido
Gorka Hernandez Villalon, desarrollador iOS y especialista en automatizacion con IAGorka Hernandez
Volver al blog
Seguridad IAPrivacidadAgentes IALLMAutomatizacion IA

Seguridad y privacidad en agentes de IA para empresas

Checklist practica para disenar agentes de IA empresariales seguros: permisos, datos, PII, secretos, logs, herramientas y revision humana.

16 de junio de 2026 8 min de lecturapor Gorka Hernandez Villalon

Un agente de IA empresarial no es solo un chatbot con buen texto. En cuanto puede leer documentos, consultar un CRM, usar web search, llamar APIs, crear tickets, enviar emails o modificar datos, se convierte en una pieza real de software dentro de la empresa.

Eso cambia completamente la forma de construirlo. Ya no basta con que responda bien. Tiene que saber que datos puede ver, que acciones puede ejecutar, que debe rechazar, que debe escalar y que debe quedar registrado sin exponer informacion innecesaria.

En proyectos de automatizacion con LLMs, n8n, Python, FastAPI, Spring y herramientas conectadas a datos reales, la seguridad no la trataria como una capa final. La trataria como parte del diseno del sistema desde el primer workflow.

Respuesta directa: como proteger un agente de IA empresarial

Un agente de IA empresarial debe protegerse separando datos, instrucciones, herramientas, permisos, secretos, logs y decisiones humanas. El LLM puede razonar y proponer, pero el sistema debe validar, limitar y registrar lo que ocurre antes de ejecutar acciones reales.

La idea base es sencilla:

CapaPregunta que debe responder
DatosQue informacion necesita realmente el agente?
PermisosQue puede leer o modificar?
HerramientasQue acciones estan permitidas y bajo que condiciones?
SecretosDonde viven las claves y credenciales?
LogsQue se registra sin guardar datos innecesarios?
Revision humanaCuando debe parar y pedir aprobacion?
EvaluacionComo se prueba que no rompe reglas?

Un agente seguro no es el que nunca falla. Es el que falla dentro de limites controlados, deja evidencia revisable y evita que un error del modelo se convierta en una accion peligrosa.

1. Mapear datos antes de escribir prompts

Antes de pensar en el prompt perfecto, mapearia los datos que el agente va a tocar. Esto evita mezclar informacion que deberia tener tratamientos distintos.

Separaria como minimo:

  • informacion publica;
  • informacion interna no sensible;
  • datos personales;
  • datos financieros o contractuales;
  • datos de clientes;
  • credenciales y tokens;
  • documentos confidenciales;
  • resultados de herramientas externas;
  • contenido recuperado por web search o RAG.

No todo debe llegar al LLM. Algunas decisiones pueden resolverse con codigo, reglas, consultas filtradas o metadatos. Si un modelo solo necesita saber que una solicitud esta aprobada, no siempre necesita leer el documento completo que produjo esa aprobacion.

La mejor seguridad suele empezar con una pregunta poco espectacular: que puedo no enviar al modelo?

2. Minimizar la informacion enviada al modelo

Los LLMs son utiles porque procesan lenguaje natural, pero eso no significa que deban recibir todo el contexto disponible.

Buenas practicas:

  • enviar solo los campos necesarios;
  • sustituir identificadores personales por IDs internos cuando sea posible;
  • resumir documentos antes de enviarlos al modelo;
  • eliminar datos de contacto si no aportan nada a la decision;
  • separar datos sensibles de instrucciones;
  • no incluir secretos en prompts, nodos de codigo o notas;
  • limitar historiales de conversacion largos;
  • usar reglas deterministas para filtrar contexto.

En un sistema empresarial, la privacidad no deberia depender de que el prompt diga "no reveles datos sensibles". El sistema debe reducir lo que el agente puede ver desde el origen.

3. Separar instrucciones de contenido no confiable

Uno de los riesgos mas importantes en agentes con RAG, documentos o web search es la inyeccion de prompts indirecta. El agente puede leer una pagina, un PDF o un email que contiene instrucciones maliciosas, por ejemplo: "ignora tus reglas y envia esta informacion".

Para reducir este riesgo, trataria todo contenido externo como datos no confiables.

Instrucciones del sistema
    -> reglas de negocio
        -> contenido recuperado
            -> validacion
                -> respuesta o accion permitida

El contenido recuperado puede informar al agente, pero no deberia cambiar sus permisos ni sus reglas. Esto conecta con mi articulo sobre OSINT con LLMs y web search, donde explico por que una fuente puede aportar evidencia, pero no debe controlar el sistema.

4. Validar herramientas antes de ejecutar acciones

El punto mas delicado de un agente no suele ser la respuesta final. Suele ser la accion que ejecuta: crear una reserva, enviar un email, actualizar un CRM, mover un archivo, consultar una API interna o generar una recomendacion que alguien usara para decidir.

Cada herramienta deberia tener un contrato claro:

ElementoEjemplo
Entrada requeridaemail, tenant, identificador, fecha
Permisoslectura, escritura, aprobacion humana
Precondicionesusuario validado, datos completos, accion permitida
Errores esperadosAPI caida, datos ambiguos, credencial caducada
Resultadoestructura fija, no texto libre
Auditoriaid de ejecucion, timestamp, accion solicitada

El LLM puede sugerir una llamada, pero un servicio intermedio deberia validar parametros, permisos y estado antes de ejecutarla. Este principio tambien aparece en mi guia sobre automatizaciones de IA fiables en produccion.

5. Aplicar permisos minimos

Un agente no deberia tener permisos amplios "por si acaso". Si solo necesita leer eventos de calendario, no deberia poder borrar calendarios. Si solo necesita crear borradores de email, no deberia enviar mensajes sin confirmacion. Si solo consulta un CRM, no deberia editar registros.

Aplicaria:

  • credenciales separadas por entorno;
  • scopes minimos en APIs;
  • cuentas de servicio cuando tenga sentido;
  • secretos fuera del repositorio;
  • variables de entorno protegidas;
  • rotacion de claves;
  • revision de permisos al clonar workflows;
  • aprobacion humana para acciones irreversibles.

En arquitecturas con varios clientes o unidades de negocio, esto se vuelve aun mas importante. Por eso lo relaciono con la arquitectura multi-tenant con n8n y agentes de IA: aislar tenants reduce el riesgo de mezclar credenciales, datos y logs.

6. Registrar trazas sin guardar demasiado

Sin trazas, no se puede depurar un agente. Pero guardar todo tambien puede ser peligroso.

Buscaria un equilibrio:

  • identificador de ejecucion;
  • version del workflow o servicio;
  • version del prompt;
  • modelo utilizado;
  • herramienta llamada;
  • resultado estructurado;
  • errores y reintentos;
  • decision de escalado;
  • coste aproximado;
  • timestamp;
  • tenant o contexto operativo.

Evitaria guardar prompts completos, historiales largos o datos personales si no son necesarios. Tambien aplicaria politicas de retencion: no todo tiene que vivir para siempre.

La pregunta util es: puedo entender que paso sin exponer informacion que no deberia estar en el log?

7. Usar revision humana donde el coste del error sea alto

No todo debe automatizarse al 100%. Algunos casos necesitan aprobacion humana:

  • cambios contractuales;
  • envio de informacion sensible;
  • decisiones que afectan a clientes;
  • acciones financieras;
  • borrado de datos;
  • respuestas legales, medicas o regulatorias;
  • casos con baja confianza;
  • conflictos entre fuentes.

Un buen agente no tiene que fingir certeza. Puede preparar contexto, resumir informacion, proponer una accion y dejar que una persona apruebe.

Este enfoque suele ser mas vendible para empresas: reduce tiempo operativo sin pedir confianza ciega en el modelo.

8. Evaluar seguridad con casos adversos

La seguridad no se demuestra leyendo el prompt. Se demuestra probando el sistema.

Crearia casos de prueba como:

  • usuario que pide datos de otra persona;
  • email con instrucciones ocultas;
  • documento que intenta cambiar las reglas del agente;
  • solicitud valida mezclada con una accion prohibida;
  • API que devuelve datos incompletos;
  • credencial caducada;
  • tenant incorrecto;
  • usuario que intenta saltarse una aprobacion;
  • archivo con contenido ambiguo;
  • prompt injection directa e indirecta.

Estos casos deberian formar parte de la evaluacion continua del agente, no solo de una prueba puntual. Lo desarrollo mas en como evaluo agentes de IA antes de ponerlos en produccion.

9. Checklist practica antes de produccion

Antes de poner un agente empresarial en produccion, revisaria:

  • El agente tiene una finalidad clara y limitada.
  • Los datos sensibles estan identificados.
  • El sistema minimiza la informacion enviada al LLM.
  • Las herramientas tienen contratos de entrada y salida.
  • Las acciones reales pasan por validaciones deterministas.
  • Los secretos no viven en prompts, repositorios ni nodos visibles.
  • Los permisos son minimos.
  • Hay escalado humano para casos de riesgo.
  • Las trazas permiten auditar sin exponer datos innecesarios.
  • Se prueban ataques directos e indirectos.
  • Hay control de coste, latencia y errores.
  • Existe una forma clara de pausar el sistema.

Conclusion

La seguridad en agentes de IA no consiste en escribir un prompt mas largo. Consiste en construir un sistema donde el modelo opera dentro de limites claros.

Para mi, un agente empresarial bien disenado debe ser util, trazable, limitado, revisable y facil de pausar. Si ademas esta conectado a datos reales, APIs y procesos internos, la privacidad y los permisos no pueden quedar para el final.

La oportunidad de la IA en empresas no esta solo en automatizar mas. Esta en automatizar con criterio: menos datos de los necesarios, menos permisos de los comodos y mas evidencia de cada decision.