TTS
Page 1 of 1

NAVA: Generación Audio-Video Sincronizada y Nativa con Alineación MMDiT
NAVA es un generador conjunto de audio-video de 6.3B parámetros que sintetiza video y audio sincronizados a partir de un único prompt. Utiliza un MMDiT de "Alinear-y-Fusionar" para establecer correspondencia audio-video, permitiendo generación rápida de 720p, audio estéreo de doble canal y control preciso de timbre multi-locutor.

UNISON: Generación y Edición Unificada de Sonido con Fusión de LLM Profundo
UNISON es un marco unificado de flujo de coincidencia latente para la generación y edición de audio y voz. Utilizando un único conjunto de pesos, integra texto a audio, texto a voz, clonación de hablantes, generación de escenas mixtas y edición de audio/voz en un solo modelo y arquitectura.

Dentro de la Arquitectura TML-Interaction: Redefiniendo la Colaboración en IA
Descubre cómo la arquitectura de doble modelo de TML-Interaction, con su diseño de múltiples flujos y microturnos, permite una interacción fluida y en tiempo real con la IA. Exploramos la mecánica, los puntos de referencia y el futuro de la colaboración humano-IA.

Sophia AI: suite completa de LLM en griego para la soberanÃa digital
En este video se presenta la suite de modelos de lenguaje grandes (LLM) de Sophia AI, entrenados especÃficamente para el griego. Se demuestran capacidades de generación de texto, imágenes, video, voz y un agente de investigación. La empresa destaca los pilares de soberanÃa digital: control total sobre el modelo, datos ubicados en Grecia bajo jurisdicción de la UE y conjuntos de datos griegos de alta calidad. Los modelos superan en al menos un 50% a otros modelos de código abierto en griego. También se presentan ofertas comerciales y próximos productos como MCP, RAG y Sophia Meet.