https://alia.gob.es/
Durante años, la conversación sobre inteligencia artificial ha estado dominada por modelos entrenados sobre todo en inglés y bajo lógicas marcadas por los grandes actores tecnológicos globales. En ese contexto, ALIA representa algo distinto: una infraestructura pública de IA pensada para impulsar el castellano y las lenguas cooficiales —catalán y valenciano, euskera y gallego— dentro del desarrollo tecnológico europeo. No se presenta solo como un proyecto técnico, sino como una pieza estratégica para que la innovación también responda a nuestra realidad lingüística, cultural e institucional.
La idea de fondo es potente. España no plantea ALIA como una caja negra cerrada, sino como una base abierta y transparente que pueda ser útil para ciudadanía, administración pública, universidades, investigadores y empresas. En la web oficial se define como una iniciativa con financiación 100% pública, orientada al acceso universal y alineada con los estándares de transparencia del Reglamento europeo de IA. Esa combinación entre apertura, utilidad pública y ambición tecnológica convierte a ALIA en una propuesta poco habitual dentro del ecosistema actual de la IA.
También importa cómo se está construyendo. El proyecto está coordinado por el Barcelona Supercomputing Center y se apoya en la capacidad de cálculo de MareNostrum 5, uno de los superordenadores más potentes del mundo. Según la información oficial, el entrenamiento de la familia de modelos ALIA ha requerido miles de horas de supercomputación, y MareNostrum 5 alcanza una velocidad de 314.000 billones de cálculos por segundo. Detrás del discurso institucional hay, por tanto, una infraestructura real, costosa y altamente especializada.
Uno de los puntos más relevantes es que ALIA ya no es solo promesa. Desde principios de 2025 están disponibles los primeros modelos del proyecto, y en esa familia destaca ALIA-40B, con 40.000 millones de parámetros. Según datos difundidos por la propia administración, fue entrenado durante más de ocho meses en MareNostrum 5, procesando 6,9 billones de tokens, equivalentes a unos 33 terabytes de texto. Además, el peso del español y de las lenguas cooficiales en su entrenamiento se sitúa en torno al 20%, una proporción muy superior a la habitual en modelos dominados por contenido en inglés.
¿Por qué esto puede ser importante? Porque una IA entrenada con más profundidad en nuestras lenguas puede entender mejor matices culturales, administrativos y contextuales que a menudo se pierden en sistemas generalistas. Y eso tiene traducción práctica. La propia documentación del proyecto apunta a beneficios para desarrolladores, pymes, administración pública, ciudadanía e investigadores. No hablamos solo de chatbots bonitos, sino de una base para crear servicios, automatizaciones, herramientas de apoyo y productos digitales con más precisión local y más control institucional.
Las aplicaciones potenciales son especialmente interesantes cuando se aterrizan en sectores concretos. Ya se han citado pilotos vinculados a la Agencia Tributaria para agilizar trabajo interno y atención ciudadana, y también una línea aplicada a atención primaria para mejorar el diagnóstico precoz de insuficiencias cardíacas. A eso se suman escenarios muy plausibles en educación, justicia o traducción entre lenguas cooficiales, donde disponer de modelos entrenados con contexto normativo y lingüístico propio puede marcar una diferencia real frente a soluciones genéricas.
Otro detalle que merece atención es que el proyecto no se limita al lanzamiento del modelo. En 2026 se ha organizado un “Desafío ALIA” orientado a alinear mejor ALIA-40B Instruido para hacerlo más transparente, seguro, justo y libre de sesgos. Las categorías del reto incluyen ámbitos como difamación, odio, privacidad, asesoramiento especializado o sesgos de género. Esto sugiere que la ambición no es únicamente tener un modelo propio, sino construir también mecanismos de evaluación, mejora y gobernanza alrededor de él.
Desde una mirada estratégica, ALIA toca una cuestión de fondo: la soberanía tecnológica. Si la IA va a influir en cómo aprendemos, trabajamos, nos relacionamos con la administración y producimos conocimiento, depender por completo de modelos ajenos tiene costes culturales, económicos y políticos. Que exista una infraestructura pública europea, abierta y multilingüe como ALIA no resuelve por sí sola ese problema, pero sí abre una vía distinta: la de construir tecnología útil, auditable y más cercana a las necesidades reales de la sociedad.
ALIA no debería medirse solo por su potencia técnica, sino por su capacidad para convertirse en una base de valor público. Si consigue activar ecosistema, atraer talento, facilitar casos de uso reales y mantener una lógica de transparencia, puede convertirse en una de las iniciativas más relevantes del panorama tecnológico español en los próximos años. Y eso, en un momento en el que casi toda la IA parece venir empaquetada desde fuera, no es un detalle menor.
Toni Domenech
