TTS

Page 1 of 1

Descubre NAVA, el generador de audio-video de 6.3B parámetros que sintetiza contenido sincronizado de 720p en minutos, con audio de doble canal y control preciso de timbre multi-locutor.

NAVA: Generación Audio-Video Sincronizada y Nativa con Alineación MMDiT

NAVA es un generador conjunto de audio-video de 6.3B parámetros que sintetiza video y audio sincronizados a partir de un único prompt. Utiliza un MMDiT de "Alinear-y-Fusionar" para establecer correspondencia audio-video, permitiendo generación rápida de 720p, audio estéreo de doble canal y control preciso de timbre multi-locutor.

Un marco latente de flujo de coincidencia para audio y voz, integrando múltiples tareas en un solo modelo.

UNISON: Generación y Edición Unificada de Sonido con Fusión de LLM Profundo

UNISON es un marco unificado de flujo de coincidencia latente para la generación y edición de audio y voz. Utilizando un único conjunto de pesos, integra texto a audio, texto a voz, clonación de hablantes, generación de escenas mixtas y edición de audio/voz en un solo modelo y arquitectura.

Un análisis profundo de cómo los modelos de interacción de TML-Interaction-Small superan los cuellos de botella actuales, logrando una IA verdaderamente conversacional y colaborativa.

Dentro de la Arquitectura TML-Interaction: Redefiniendo la Colaboración en IA

Descubre cómo la arquitectura de doble modelo de TML-Interaction, con su diseño de múltiples flujos y microturnos, permite una interacción fluida y en tiempo real con la IA. Exploramos la mecánica, los puntos de referencia y el futuro de la colaboración humano-IA.

Demostración en vivo de modelos de lenguaje, generación de imágenes y video, con énfasis en soberanía tecnológica, lingüística y de datos

Sophia AI: suite completa de LLM en griego para la soberanía digital

En este video se presenta la suite de modelos de lenguaje grandes (LLM) de Sophia AI, entrenados específicamente para el griego. Se demuestran capacidades de generación de texto, imágenes, video, voz y un agente de investigación. La empresa destaca los pilares de soberanía digital: control total sobre el modelo, datos ubicados en Grecia bajo jurisdicción de la UE y conjuntos de datos griegos de alta calidad. Los modelos superan en al menos un 50% a otros modelos de código abierto en griego. También se presentan ofertas comerciales y próximos productos como MCP, RAG y Sophia Meet.