Sophia AI: suite completa de LLM en griego para la soberanía digital

Demostración en vivo de modelos de lenguaje, generación de imágenes y video, con énfasis en soberanía tecnológica, lingüística y de datos

22 de mayo de 2026

#Agentes #Generación de Contenido #LLM #STT #TTS

En este video se presenta la suite de modelos de lenguaje grandes (LLM) de Sophia AI, entrenados específicamente para el griego. Se demuestran capacidades de generación de texto, imágenes, video, voz y un agente de investigación. La empresa destaca los pilares de soberanía digital: control total sobre el modelo, datos ubicados en Grecia bajo jurisdicción de la UE y conjuntos de datos griegos de alta calidad. Los modelos superan en al menos un 50% a otros modelos de código abierto en griego. También se presentan ofertas comerciales y próximos productos como MCP, RAG y Sophia Meet.

El caso de la soberanía digital en la IA

Los gigantes globales de la IA dominan el mercado, pero sus modelos a menudo no logran capturar los matices culturales, legales y lingüísticos locales. En Grecia, este desajuste provoca una mera tasa de adopción del 9,81 % (puesto 18 en la UE). Más allá de la mala experiencia de usuario, la dependencia de infraestructuras extranjeras crea riesgos de erosión de la soberanía de datos y un posible incumplimiento legal según el GDPR y la Ley de IA de la UE.

La suite de modelos de lenguaje griegos de Sophia AI aborda directamente estas carencias. La misión es ofrecer una pila completa de IA que permita la ejecución soberana de tareas — capacidades que de otro modo solo están disponibles en inglés.

Los tres pilares de la soberanía

El enfoque de Sophia AI se basa en tres pilares de soberanía:

Soberanía tecnológica — control total sobre el modelo, la seguridad y la infraestructura.
Soberanía lingüística — entrenamiento en conjuntos de datos griegos seleccionados y de alta calidad (no meras traducciones) para capturar el uso auténtico del idioma.
Soberanía de datos — todos los servidores ubicados en Grecia bajo la jurisdicción de la UE, lo que garantiza el cumplimiento del GDPR y la Ley de IA.

La familia de modelos

Sophia AI despliega una gama de modelos para diferentes casos de uso:

Generación de texto:

Serie W (chat polivalente): W2 small (7B parámetros) y W2 large (235M parámetros). Ambos son multimodales y no razonadores.
Serie K (razonamiento): K1 small (32B) y K2 large (80B).

Suite creativa:

Generación de imágenes: Sophia I1 (pequeño, fuerte) y Sophia I2 (edición de imágenes).
Generación de vídeo: Sophia V1 (30 fps, clips de 10 segundos). Una demostración muestra animación generada a partir de un solo fotograma estático.

Voz:

Modelo ASR alcanza una tasa de error de palabra del 7,08 % en griego — la más baja reportada para el reconocimiento de voz en griego.
Modelo DTS produce síntesis de voz griega auténtica.

Agente de investigación:

Sophia Research es un agente de búsqueda de información de largo alcance que itera en la web, recopila fuentes, resume y las cita, minimizando las alucinaciones.

Capacidades en la práctica

Las siguientes tareas demuestran la amplitud de la suite:

Análisis de texto: Se procesa un artículo de investigación (de Yann LeCun) para producir un resumen ejecutivo, contribuciones clave, metodología, resultados y limitaciones.
Generación de imágenes: Una descripción del Museo de la Acrópolis con instrucciones específicas sobre el objetivo produce un resultado que sigue el paradigma indicado.
Edición de imágenes: Usando Sophia I2 sobre la imagen generada, una solicitud para cambiar el cielo a atardecer produce tonos naranjas precisos.
Generación de vídeo: A partir de un fotograma inicial, Sophia V1 lo anima en un clip corto.
Agente de investigación: Una consulta sobre inversiones en energía verde en el norte de Grecia durante tres años desencadena búsquedas web de varias rondas, reflexión, resumen y un informe final con citas.

Entrenamiento y puntos de referencia

Los modelos de Sophia AI se someten a un entrenamiento en múltiples etapas:

Preentrenamiento continuo (CPT) en 14 mil millones de tokens griegos.
Ajuste fino supervisado (SFT) en 17 millones de muestras.

En los puntos de referencia, los modelos de Sophia superan a otros modelos griegos de código abierto en al menos un 50 % (siendo el modelo Sophia K2 el que muestra el mayor margen).

La seguridad se maneja mediante barreras de protección (Guard) tanto en la entrada como en la salida para garantizar el cumplimiento de las normativas.

Ofertas comerciales y próximos productos

Sophia AI está disponible en dos niveles:

Plus — incluye una prueba gratuita mediante código QR.
Pro — incluye una prueba de una semana. Todos los modelos están disponibles en ambos niveles; los límites de uso varían. Para empresas, la plataforma garantiza 100 % de soberanía de datos e infraestructura.

Los próximos productos incluyen:

MCP (Protocolo de Contexto de Modelo) — se conecta al correo electrónico, calendario y aplicaciones externas, permitiendo acciones como enviar correos o unirse a llamadas directamente desde la interfaz de chat.
Solución RAG — generación aumentada por recuperación integral para empresas, que se conecta a wikis internos y repositorios de datos para preguntas y respuestas en circuito cerrado.
Sophia Meet — asiste a reuniones de Microsoft Teams, proporcionando análisis de información en vivo e informes posteriores a la reunión. Se planea compatibilidad con más plataformas.

Los conceptos aquí cubiertos se aprecian mejor en la práctica. El video recorre cada paso en detalle y vale la pena verlo para apreciar plenamente cómo se comportan los modelos y cómo se implementan las garantías de soberanía.