Análisis en profundidad del Top 10 de OWASP para Agentes 2026

Alessandro Pignati • 19 de diciembre de 2025

Contenido

El panorama de la IA ha pasado rápidamente de las aplicaciones LLM de un solo turno a las Aplicaciones Agénticas: sistemas autónomos capaces de planificar, tomar decisiones y ejecutar tareas de múltiples pasos en diversos entornos y herramientas. Este Paradigma Agéntico introduce una nueva y compleja superficie de seguridad.

El actual OWASP Top 10 para Aplicaciones LLM (LLM Top 10) es insuficiente. La capacidad de un agente para encadenar acciones y operar de forma autónoma significa que una vulnerabilidad menor, como una simple inyección de prompt, puede escalar rápidamente hasta convertirse en un compromiso de todo el sistema, exfiltración de datos o pérdidas financieras. El desafío de seguridad ya no consiste en asegurar una única llamada al modelo, sino en proteger un flujo de trabajo complejo, dinámico y, a menudo, impredecible.

Para abordar esto, el Proyecto de Seguridad de Gen AI de OWASP publicó el OWASP Top 10 for Agentic Applications (2026), la Iniciativa de Seguridad Agéntica (ASI) Top 10. Este documento es la brújula esencial para líderes de seguridad, arquitectos y desarrolladores. Destila las amenazas de mayor impacto en diez categorías accionables.

Este post ofrece un desglose técnico y exhaustivo del ASI Top 10. Comprender estas vulnerabilidades, desde ASI01: Secuestro de Objetivos del Agente hasta ASI10: Agentes Rebeldes, es innegociable. Analizaremos los conceptos centrales, exploraremos las diferencias entre estas nuevas amenazas y sus predecesoras de la era LLM, e integraremos nuestra perspectiva sobre los imperativos arquitectónicos para asegurar el futuro agéntico.

El Cambio de Paradigma Agéntico: Por Qué la Autonomía lo Cambia Todo

La característica definitoria de una Aplicación Agéntica es su autonomía. Un agente logra un objetivo de alto nivel seleccionando, planificando y ejecutando dinámicamente una secuencia de acciones utilizando un LLM (el "cerebro"), un Planificador y un conjunto de Herramientas (APIs, bases de datos, intérpretes de código) para interactuar con el mundo real.

Esta autonomía es la fuente de un riesgo profundo. Los agentes amplifican las vulnerabilidades existentes porque operan en un estado de Agencia Excesiva. Una vulnerabilidad contenida en un LLM ahora puede ser aprovechada por un agente para realizar una cadena de acciones de alto impacto: leer un archivo sensible, generar código malicioso y exfiltrar datos.

El documento de OWASP introduce dos principios fundamentales para sistemas agénticos seguros:

Mínima Agencia: Una extensión del Principio de Menor Privilegio. Evitar la autonomía innecesaria. A los agentes solo se les debe conceder el nivel mínimo de autonomía requerido para completar su tarea definida.
Observabilidad Sólida: Un control de seguridad innegociable. Requiere una visibilidad clara y completa de lo que hacen los agentes, por qué y qué herramientas están invocando. El registro detallado del estado del objetivo, los patrones de uso de herramientas y las rutas de decisión es obligatorio.

El OWASP Agentic Top 10: Un Desglose Técnico

Las diez vulnerabilidades identificadas por la Iniciativa de Seguridad Agéntica (ASI) representan los riesgos más críticos en el ecosistema de IA autónoma. Cada amenaza requiere una comprensión matizada del ciclo de vida del agente y su interacción con el entorno.

ASI01: Secuestro de Objetivos del Agente (Agent Goal Hijack)

El Secuestro de Objetivos del Agente es la nueva "Inyección SQL" para el mundo autónomo. Ocurre cuando un atacante manipula los objetivos centrales, la selección de tareas o las rutas de toma de decisiones de un agente. A diferencia de la inyección de prompt tradicional (LLM01), que suele ser transitoria, el Secuestro de Objetivos captura el impacto agéntico más amplio donde las entradas manipuladas redirigen metas, planificación y comportamiento multietapa. Esto puede lograrse indirectamente a través de fuentes de datos externas o salidas de herramientas engañosas. Consideramos que esta es una vulnerabilidad fundamental que debe abordarse a nivel arquitectónico, no parchearse con filtros. La defensa principal es tratar todas las entradas de lenguaje natural como no confiables, canalizándolas a través de una validación rigurosa. Crucialmente, el patrón de "Cápsula de Intención" (una envoltura firmada e inmutable que vincula el mandato original del agente a cada ciclo de ejecución) es un requisito arquitectónico obligatorio, junto con un mecanismo de humano-en-el-bucle para acciones de alto impacto.

ASI02: Uso Indebido y Explotación de Herramientas

Describe un escenario en el que un agente utiliza una herramienta legítima y autorizada de manera insegura o no intencionada, causando daño debido a instrucciones ambiguas o manipulación dirigida por prompts. El agente opera dentro de sus privilegios existentes, lo que lo distingue de ASI03 (abuso de privilegios) y ASI05 (ejecución de código). Este es un fallo directo del principio de Mínima Agencia; si un agente puede usar mal una herramienta, el alcance de la misma era intrínsecamente demasiado amplio. Abogamos por un modelo de Herramientas de Confianza Cero donde cada llamada se trate como una operación de alto riesgo. La mitigación requiere definir permisos estrictos, granulares y "justo a tiempo" para todas las herramientas, y nunca pasar ciegamente la salida generada por un LLM a una herramienta sin una validación rigurosa frente a un esquema estricto. Plataformas como NeuralTrust apoyan este modelo permitiendo permisos de herramientas de grano fino y controles basados en políticas.

ASI03: Abuso de Identidad y Privilegios

Aborda el riesgo de que un agente escale sus privilegios, ya sea abusando de su propia identidad o heredando las credenciales de otras herramientas o servicios. Los agentes son la clase de Identidades No Humanas (NHI) más peligrosa jamás creada. Debemos tratarlos con más sospecha que a los usuarios humanos, exigiendo una Gestión de Identidad Zero-Trust donde las credenciales de larga duración sean un riesgo inaceptable. Cada agente debe tener su propia identidad única y gestionada con los permisos mínimos requeridos, utilizando credenciales temporales basadas en sesiones que expiren al completar la tarea.

ASI04: Vulnerabilidades en la Cadena de Suministro Agéntica

Surgen porque las aplicaciones agénticas dependen de una cadena de suministro compleja de componentes externos: APIs de terceros, modelos pre-entrenados, fuentes de datos RAG y definiciones de herramientas. Una vulnerabilidad en cualquiera de estos componentes puede ser heredada por el agente. Sostenemos que la cadena de suministro para agentes se extiende más allá del código hacia los datos y los modelos, haciendo que la validación continua y las verificaciones de integridad sean la única defensa viable. Las organizaciones deben mantener un Software Bill of Materials (SBOM) que incluya activos específicos de IA.

ASI05: Ejecución de Código No Esperada (RCE)

Ocurre cuando un atacante manipula al agente para que genere y ejecute código malicioso (por ejemplo, para exfiltrar datos o establecer una shell reversa). Esta es una forma específica y crítica de ASI02. Nuestra perspectiva es que cualquier agente con capacidades de ejecución de código es un riesgo crítico sin un sandbox de acceso cero reforzado por hardware. El sandboxing solo por software es insuficiente. Todo código generado por un LLM debe ejecutarse en un entorno aislado sin acceso al sistema host o a recursos de red sensibles.

ASI06: Envenenamiento de Memoria y Contexto

Es la corrupción persistente de la información almacenada del agente (bases de datos vectoriales, grafos de conocimiento) que informa decisiones futuras. Un atacante inyecta datos maliciosos en la memoria a largo plazo del agente, causando que exhiba comportamientos desalineados o dañinos con el tiempo. La palabra clave aquí es persistente. Debemos tratar el almacenamiento de memoria a largo plazo del agente como una base de datos altamente sensible, exigiendo verificaciones de integridad criptográfica y una higienización rigurosa de todos los datos ingeridos.

ASI07: Comunicación Insegura entre Agentes

Surge en sistemas multi-agente complejos cuando los canales de comunicación son vulnerables a la interceptación, falsificación de mensajes o ataques de repetición. Los sistemas multi-agente son sistemas distribuidos y deben asegurarse como tales. Debemos aplicar firmas criptográficas de grado militar y TLS mutuo (mTLS) a toda la comunicación interna, ya que confiar en la identidad de un agente basándose únicamente en su ubicación de red es un error arquitectónico fatal.

ASI08: Fallos en Cascada

Ocurren cuando un pequeño fallo en un componente desencadena una reacción en cadena que conduce a un fallo descontrolado en todo el sistema, resultando a menudo en que el planificador del agente ejecute acciones cada vez más destructivas o costosas al intentar recuperarse. Vemos los fallos en cascada como un defecto de diseño. Cada flujo de trabajo agéntico debe diseñarse con disyuntores (circuit breakers) y capacidades de reversión (rollback) transaccional.

ASI09: Explotación de la Confianza Humano-Agente

Se dirige a la confianza del usuario humano en el agente; un atacante manipula la salida del agente para engañar al humano y hacer que evite controles de seguridad o apruebe acciones maliciosas. Nuestra perspectiva es que el humano es el eslabón más débil. El "humano en el bucle" debe ser un paso de revisión crítica, no un simple trámite automático, requiriendo que el agente articule claramente por qué propone una acción.

ASI10: Agentes Rebeldes (Rogue Agents)

Son entidades autónomas que se desvían de su propósito previsto o exhiben un comportamiento desalineado sin manipulación externa activa, a menudo debido a fallos en la función de recompensa o en el modelo de gobernanza. El "botón de pánico" (kill switch) debe ser un mecanismo innegociable, auditable y físicamente aislado. Además, debe existir un monitoreo conductual continuo para detectar desviaciones sutiles antes de que se conviertan en una desalineación catastrófica.

Implicaciones Arquitectónicas y Operativas

El OWASP Agentic Top 10 no es solo una lista de vulnerabilidades; es un mandato para un cambio fundamental en cómo abordamos la arquitectura de los sistemas de IA.

El Principio de Mínima Agencia en la Práctica

La Mínima Agencia dicta que la autonomía es una característica que se gana, no una configuración por defecto. En la práctica, esto significa:

Agencia Justo a Tiempo: Otorgar autonomía solo para la tarea específica y de corta duración que se está ejecutando.
Gestión de Configuración: Definir objetivos y acciones permitidas a través de archivos de configuración explícitos y auditables.

La Observabilidad como Control de Seguridad

Para defenderse contra amenazas como ASI08 y ASI10, las organizaciones deben:

Registrar Todo: Mantener logs exhaustivos de cada decisión, llamada a herramienta y cambio de estado.
Líneas Base de Comportamiento: Establecer un comportamiento normal esperado. Cualquier desviación debe activar una alerta inmediata.

Red Teaming

El pentesting tradicional es insuficiente. Los equipos de seguridad deben realizar pruebas periódicas que simulen ataques multietapa complejos. Soluciones como la plataforma de red teaming automatizado de NeuralTrust permiten a los equipos simular sistemáticamente patrones de ataque del mundo real y evaluar el comportamiento del agente bajo condiciones adversas.

Asegurando el Futuro de la IA Agéntica

El OWASP Top 10 para Aplicaciones Agénticas 2026 marca un antes y un después. Es un reconocimiento claro de que el cambio hacia sistemas autónomos ha introducido una nueva clase de amenazas de alto impacto que no pueden abordarse con modelos de seguridad heredados.

Para cualquier organización que despliegue agentes autónomos, el ASI Top 10 es el plano definitivo para la mitigación de riesgos. El futuro de la IA es autónomo; asegurar ese futuro requiere la adopción inmediata e integral de la Iniciativa de Seguridad Agéntica de OWASP.

Avanzando Juntos en la Seguridad de la IA Agéntica

En NeuralTrust, apoyamos activamente las iniciativas que aportan estructura y transparencia al campo de la seguridad de la IA agéntica. Nuestro trabajo está impulsado por el compromiso de dotar a los defensores de las herramientas necesarias para entender cómo se comportan los agentes en la práctica y cómo pueden fallar.

Si desea obtener más información sobre cómo NeuralTrust ayuda a las organizaciones a identificar y mitigar los riesgos emergentes en la IA agéntica, estaremos encantados de conectar.