Modelo de Lenguaje Soberano para la Administración Pública: Qué es y Por Qué Importa

Cuando una administración pública contrata un asistente de inteligencia artificial, se hace una pregunta que rara vez aparece en los pliegos técnicos: ¿dónde se procesa la información que introducen los ciudadanos?

La respuesta importa más de lo que parece. Importa para el cumplimiento del RGPD. Importa para el ENS. Importa para el AI Act. Y, en algunos casos, importa para la seguridad nacional.

En 2026, el debate sobre la soberanía del dato en la administración pública española ha llegado también a los modelos de lenguaje grande (LLM, Large Language Models). Este artículo explica qué es un LLM soberano, cuándo es necesario y cómo implementarlo.

¿Qué es un modelo de lenguaje soberano?

Un LLM soberano (también llamado LLM local o LLM on-premise) es un modelo de inteligencia artificial que se ejecuta íntegramente en la infraestructura controlada por la organización que lo despliega — sin enviar datos a servidores de terceros, sin depender de APIs externas y sin que el proveedor del modelo pueda acceder a las conversaciones.

En contraposición, la mayoría de asistentes de IA basados en la nube procesan las consultas en servidores del proveedor (OpenAI, Google, Anthropic, etc.), ubicados frecuentemente fuera de la Unión Europea.

Diferencias clave

Criterio	LLM cloud (API externa)	LLM soberano (local / cloud ES-UE)
Dónde se procesan los datos	Servidores del proveedor (puede ser EE.UU.)	Servidores propios o cloud certificado ENS en la UE
Quién puede acceder a las conversaciones	El proveedor, según sus condiciones	Nadie fuera de la organización
Dependencia de terceros	Alta — si el servicio cae, el asistente deja de funcionar	Baja — funciona aunque el proveedor externo tenga problemas
Adaptabilidad del modelo	Limitada por las condiciones del proveedor	Total — el modelo puede ajustarse, monitorizarse y auditarse
Coste	Variable según uso (pay-per-token)	Mayor inversión inicial, menor coste marginal por consulta
Cumplimiento RGPD	Requiere SCCs o BCRs si hay transferencias fuera de la UE	Completo sin cláusulas adicionales

Por qué la soberanía del dato es crítica para la administración pública

El marco jurídico: RGPD y transferencias internacionales

El Reglamento General de Protección de Datos prohíbe transferir datos personales a países que no garanticen un nivel de protección equivalente al europeo, salvo que existan mecanismos jurídicos adecuados (decisiones de adecuación, cláusulas contractuales tipo, normas corporativas vinculantes).

Cuando un ciudadano pregunta por su expediente de licencia de obras, incluye implícitamente datos personales en la conversación. Si esa conversación se procesa en servidores de EE.UU. bajo el Patriot Act o el FISA, la transferencia puede ser ilícita o requerir salvaguardas adicionales que la mayoría de administraciones no tienen formalizadas.

El Esquema Nacional de Seguridad: categoría alta

El ENS establece que los sistemas que procesan información de categoría alta deben implementar medidas adicionales de seguridad. La categoría alta aplica, entre otros, a sistemas que gestionan información de interés para la seguridad pública, datos de salud o expedientes con información sensible.

En estos casos, un modelo cloud con infraestructura fuera de España puede no cumplir con las exigencias del ENS nivel alto, independientemente de los certificados del proveedor.

El AI Act: trazabilidad y auditoría

El AI Act europeo (UE 2024/1689) exige para los sistemas de IA de alto riesgo — entre los que se incluyen los asistentes de atención ciudadana — que las organizaciones puedan auditar, monitorizar y documentar el comportamiento del sistema. Con un LLM cloud de tercero, parte de esa trazabilidad queda fuera del control de la administración.

¿Qué organismos necesitan un LLM soberano?

No todos los organismos públicos requieren un modelo soberano. La decisión depende del nivel de sensibilidad de la información procesada y del nivel ENS aplicable.

Casos donde el LLM soberano es recomendable o necesario

Tipo de organismo	Motivo
Servicios de Salud autonómicos	Datos de salud (categoría especial RGPD), ENS nivel alto
Fuerzas y Cuerpos de Seguridad del Estado	Seguridad pública, clasificación reservada
Ministerios con datos sensibles (Interior, Hacienda, Defensa)	Interés nacional, datos fiscales
Servicios sociales municipales	Datos de menores, víctimas de violencia, discapacidad
Infraestructuras críticas (agua, energía, transporte)	Operadores de servicios esenciales — NIS2
Organismos con información clasificada	Obligación legal de tratamiento en instalaciones propias

Casos donde el LLM cloud (con datos en la UE) es suficiente

Tipo de organismo	Motivo
Ayuntamientos con consultas de trámite general	Sin datos sensibles de categoría especial
Diputaciones y servicios supramunicipales	Consultas de gestión ordinaria
Universidades (atención a estudiantes)	Sin datos de salud o seguridad
Museos, patronatos culturales	Sin datos personales sensibles

Modelos open-source: la base del LLM soberano

La soberanía del modelo requiere una base de modelo que pueda ejecutarse sin licencia de uso dependiente de un tercero. Los modelos de código abierto son la opción natural:

Llama 3 (Meta): capacidades comparables a GPT-4, licencia comercial libre para organizaciones
Mistral / Mixtral (Mistral AI, empresa europea): alta eficiencia, licencia Apache 2.0
Qwen2 (Alibaba): alternativa multilingüe con fuerte soporte para español
Gemma 2 (Google): modelos compactos para entornos con recursos limitados

Estos modelos pueden ejecutarse en servidores on-premise de la administración o en instancias de cloud español (como CLOUDING.IO o servidores de centros de procesamiento de datos certificados ENS).

Cómo Agento implementa la opción de LLM soberano

Agento ofrece dos modalidades de despliegue:

Modalidad cloud (UE)

Los datos se procesan en servidores ubicados en España o la Unión Europea. No hay transferencias fuera de la UE. Es la opción estándar para la mayoría de organismos.

Modalidad LLM soberano

El modelo se despliega en la infraestructura del propio organismo — servidores físicos del centro de procesamiento o cloud privado certificado ENS. En este modo:

Ningún dato de conversación sale de los servidores del organismo
El modelo puede ser auditado completamente por el equipo técnico interno
Las actualizaciones del modelo se gestionan en acuerdo con el organismo
El coste es fijo, independiente del volumen de consultas

Proceso de implantación del LLM soberano

Análisis de requisitos — evaluación del nivel ENS aplicable, clasificación de datos y capacidad de infraestructura
Selección del modelo base — elección del LLM open-source según las capacidades necesarias y el hardware disponible
Adaptación al dominio — ajuste fino del modelo con la base documental del organismo (procedimientos, FAQs, normativa aplicable)
Despliegue en producción — instalación en la infraestructura del organismo, con acceso controlado
Monitorización y actualización — sistema de supervisión del comportamiento del modelo y protocolo de actualización periódica

El proceso completo tarda entre 4 y 8 semanas para un organismo con infraestructura propia, y entre 2 y 4 semanas si se usa cloud privado certificado ENS.

Preguntas frecuentes

¿Un LLM soberano es tan bueno como GPT-4 o Claude? Los modelos open-source actuales — especialmente Llama 3 y Mixtral — tienen capacidades muy próximas a los modelos comerciales de última generación para tareas de atención ciudadana. Para responder preguntas sobre trámites, normativa municipal y orientación de expedientes, la diferencia de rendimiento es insignificante en la práctica.

¿Qué infraestructura necesito para ejecutar un LLM localmente? Depende del modelo. Un modelo de 7B parámetros cuantizado (GGUF) puede ejecutarse en una máquina con 16 GB de RAM sin GPU dedicada. Para modelos de 70B se requieren varios servidores con GPU o infraestructura de inferencia optimizada. Agento realiza la evaluación de infraestructura como parte del proceso de onboarding.

¿Es más caro el LLM soberano que el modelo cloud? La inversión inicial es mayor (hardware o cloud privado), pero el coste marginal por consulta es prácticamente cero una vez desplegado. Para organismos con alto volumen de consultas, el LLM soberano puede ser más económico a medio plazo que el modelo cloud pay-per-token.

¿Puedo usar el LLM soberano para otros casos de uso además de la atención ciudadana? Sí. Un modelo desplegado en la infraestructura del organismo puede servir también para asistencia interna a los funcionarios, análisis de expedientes o redacción de informes — con los mismos niveles de seguridad y sin costes adicionales.

¿Cómo se actualiza el modelo si aparecen vulnerabilidades de seguridad? Agento incluye un protocolo de actualización del modelo en todos los contratos con la modalidad LLM soberano. Las actualizaciones de seguridad se coordinan con el equipo técnico del organismo y se prueban en un entorno de staging antes de pasar a producción.

Continúa leyendo: Chatbot para administraciones públicas: guía completa · ENS e inteligencia artificial en la administración pública · Reglamento IA europeo para administraciones públicas · Compliance IA sector público