Agento

LLM soberano administración pública

Modelo de Lenguaje Soberano para la Administración Pública: Qué es y Por Qué Importa

·Equipo Agento·explainerLLM soberanosoberanía del datoAI Act

Equipo de Agento

Especialistas en IA para la administración pública española · Sobre nosotros

Cuando una administración pública contrata un asistente de inteligencia artificial, se hace una pregunta que rara vez aparece en los pliegos técnicos: ¿dónde se procesa la información que introducen los ciudadanos?

La respuesta importa más de lo que parece. Importa para el cumplimiento del RGPD. Importa para el ENS. Importa para el AI Act. Y, en algunos casos, importa para la seguridad nacional.

En 2026, el debate sobre la soberanía del dato en la administración pública española ha llegado también a los modelos de lenguaje grande (LLM, Large Language Models). Este artículo explica qué es un LLM soberano, cuándo es necesario y cómo implementarlo.

¿Qué es un modelo de lenguaje soberano?

Un LLM soberano (también llamado LLM local o LLM on-premise) es un modelo de inteligencia artificial que se ejecuta íntegramente en la infraestructura controlada por la organización que lo despliega — sin enviar datos a servidores de terceros, sin depender de APIs externas y sin que el proveedor del modelo pueda acceder a las conversaciones.

En contraposición, la mayoría de asistentes de IA basados en la nube procesan las consultas en servidores del proveedor (OpenAI, Google, Anthropic, etc.), ubicados frecuentemente fuera de la Unión Europea.

Diferencias clave

Criterio LLM cloud (API externa) LLM soberano (local / cloud ES-UE)
Dónde se procesan los datos Servidores del proveedor (puede ser EE.UU.) Servidores propios o cloud certificado ENS en la UE
Quién puede acceder a las conversaciones El proveedor, según sus condiciones Nadie fuera de la organización
Dependencia de terceros Alta — si el servicio cae, el asistente deja de funcionar Baja — funciona aunque el proveedor externo tenga problemas
Adaptabilidad del modelo Limitada por las condiciones del proveedor Total — el modelo puede ajustarse, monitorizarse y auditarse
Coste Variable según uso (pay-per-token) Mayor inversión inicial, menor coste marginal por consulta
Cumplimiento RGPD Requiere SCCs o BCRs si hay transferencias fuera de la UE Completo sin cláusulas adicionales

Por qué la soberanía del dato es crítica para la administración pública

El marco jurídico: RGPD y transferencias internacionales

El Reglamento General de Protección de Datos prohíbe transferir datos personales a países que no garanticen un nivel de protección equivalente al europeo, salvo que existan mecanismos jurídicos adecuados (decisiones de adecuación, cláusulas contractuales tipo, normas corporativas vinculantes).

Cuando un ciudadano pregunta por su expediente de licencia de obras, incluye implícitamente datos personales en la conversación. Si esa conversación se procesa en servidores de EE.UU. bajo el Patriot Act o el FISA, la transferencia puede ser ilícita o requerir salvaguardas adicionales que la mayoría de administraciones no tienen formalizadas.

El Esquema Nacional de Seguridad: categoría alta

El ENS establece que los sistemas que procesan información de categoría alta deben implementar medidas adicionales de seguridad. La categoría alta aplica, entre otros, a sistemas que gestionan información de interés para la seguridad pública, datos de salud o expedientes con información sensible.

En estos casos, un modelo cloud con infraestructura fuera de España puede no cumplir con las exigencias del ENS nivel alto, independientemente de los certificados del proveedor.

El AI Act: trazabilidad y auditoría

El AI Act europeo (UE 2024/1689) exige para los sistemas de IA de alto riesgo — entre los que se incluyen los asistentes de atención ciudadana — que las organizaciones puedan auditar, monitorizar y documentar el comportamiento del sistema. Con un LLM cloud de tercero, parte de esa trazabilidad queda fuera del control de la administración.

¿Qué organismos necesitan un LLM soberano?

No todos los organismos públicos requieren un modelo soberano. La decisión depende del nivel de sensibilidad de la información procesada y del nivel ENS aplicable.

Casos donde el LLM soberano es recomendable o necesario

Tipo de organismo Motivo
Servicios de Salud autonómicos Datos de salud (categoría especial RGPD), ENS nivel alto
Fuerzas y Cuerpos de Seguridad del Estado Seguridad pública, clasificación reservada
Ministerios con datos sensibles (Interior, Hacienda, Defensa) Interés nacional, datos fiscales
Servicios sociales municipales Datos de menores, víctimas de violencia, discapacidad
Infraestructuras críticas (agua, energía, transporte) Operadores de servicios esenciales — NIS2
Organismos con información clasificada Obligación legal de tratamiento en instalaciones propias

Casos donde el LLM cloud (con datos en la UE) es suficiente

Tipo de organismo Motivo
Ayuntamientos con consultas de trámite general Sin datos sensibles de categoría especial
Diputaciones y servicios supramunicipales Consultas de gestión ordinaria
Universidades (atención a estudiantes) Sin datos de salud o seguridad
Museos, patronatos culturales Sin datos personales sensibles

Modelos open-source: la base del LLM soberano

La soberanía del modelo requiere una base de modelo que pueda ejecutarse sin licencia de uso dependiente de un tercero. Los modelos de código abierto son la opción natural:

  • Llama 3 (Meta): capacidades comparables a GPT-4, licencia comercial libre para organizaciones
  • Mistral / Mixtral (Mistral AI, empresa europea): alta eficiencia, licencia Apache 2.0
  • Qwen2 (Alibaba): alternativa multilingüe con fuerte soporte para español
  • Gemma 2 (Google): modelos compactos para entornos con recursos limitados

Estos modelos pueden ejecutarse en servidores on-premise de la administración o en instancias de cloud español (como CLOUDING.IO o servidores de centros de procesamiento de datos certificados ENS).

Cómo Agento implementa la opción de LLM soberano

Agento ofrece dos modalidades de despliegue:

Modalidad cloud (UE)

Los datos se procesan en servidores ubicados en España o la Unión Europea. No hay transferencias fuera de la UE. Es la opción estándar para la mayoría de organismos.

Modalidad LLM soberano

El modelo se despliega en la infraestructura del propio organismo — servidores físicos del centro de procesamiento o cloud privado certificado ENS. En este modo:

  • Ningún dato de conversación sale de los servidores del organismo
  • El modelo puede ser auditado completamente por el equipo técnico interno
  • Las actualizaciones del modelo se gestionan en acuerdo con el organismo
  • El coste es fijo, independiente del volumen de consultas

Proceso de implantación del LLM soberano

  1. Análisis de requisitos — evaluación del nivel ENS aplicable, clasificación de datos y capacidad de infraestructura
  2. Selección del modelo base — elección del LLM open-source según las capacidades necesarias y el hardware disponible
  3. Adaptación al dominio — ajuste fino del modelo con la base documental del organismo (procedimientos, FAQs, normativa aplicable)
  4. Despliegue en producción — instalación en la infraestructura del organismo, con acceso controlado
  5. Monitorización y actualización — sistema de supervisión del comportamiento del modelo y protocolo de actualización periódica

El proceso completo tarda entre 4 y 8 semanas para un organismo con infraestructura propia, y entre 2 y 4 semanas si se usa cloud privado certificado ENS.

Preguntas frecuentes

¿Un LLM soberano es tan bueno como GPT-4 o Claude? Los modelos open-source actuales — especialmente Llama 3 y Mixtral — tienen capacidades muy próximas a los modelos comerciales de última generación para tareas de atención ciudadana. Para responder preguntas sobre trámites, normativa municipal y orientación de expedientes, la diferencia de rendimiento es insignificante en la práctica.

¿Qué infraestructura necesito para ejecutar un LLM localmente? Depende del modelo. Un modelo de 7B parámetros cuantizado (GGUF) puede ejecutarse en una máquina con 16 GB de RAM sin GPU dedicada. Para modelos de 70B se requieren varios servidores con GPU o infraestructura de inferencia optimizada. Agento realiza la evaluación de infraestructura como parte del proceso de onboarding.

¿Es más caro el LLM soberano que el modelo cloud? La inversión inicial es mayor (hardware o cloud privado), pero el coste marginal por consulta es prácticamente cero una vez desplegado. Para organismos con alto volumen de consultas, el LLM soberano puede ser más económico a medio plazo que el modelo cloud pay-per-token.

¿Puedo usar el LLM soberano para otros casos de uso además de la atención ciudadana? Sí. Un modelo desplegado en la infraestructura del organismo puede servir también para asistencia interna a los funcionarios, análisis de expedientes o redacción de informes — con los mismos niveles de seguridad y sin costes adicionales.

¿Cómo se actualiza el modelo si aparecen vulnerabilidades de seguridad? Agento incluye un protocolo de actualización del modelo en todos los contratos con la modalidad LLM soberano. Las actualizaciones de seguridad se coordinan con el equipo técnico del organismo y se prueban en un entorno de staging antes de pasar a producción.


Continúa leyendo: Chatbot para administraciones públicas: guía completa · ENS e inteligencia artificial en la administración pública · Reglamento IA europeo para administraciones públicas · Compliance IA sector público

¿Listo para empezar?

Solicita una demo gratuita de Agento

Te mostramos el asistente con tu documentación en 30 minutos.

Solicitar demo← Volver al blog