Ajuste Fino

Page 1 of 2

Innovaciones en espacio latente continuo, condicionamiento de historial completo y post-entrenamiento autocorrector para una calidad de voz superior y eficiencia.

dots.tts: Modelo Fundacional de Texto-a-Voz Autoregresivo Continuo de 2B Parámetros

Presentamos dots.tts, un modelo de texto-a-voz autoregresivo continuo de 2B parámetros con un espacio latente continuo. Destaca por su AudioVAE multiobjetivo, condicionamiento de historial completo y post-entrenamiento autocorrector, logrando un rendimiento líder en Seed-TTS-Eval y benchmarks de código abierto.

Un cambio conceptual hacia la exploración de poblaciones de modelos para optimizar el uso del cómputo en regímenes de datos limitados.

q0: Primitivas para el Preentrenamiento Hiper-Época en Modelos de Lenguaje

Investigadores de 1Q Labs y Princeton University presentan q0, un enfoque de preentrenamiento hiper-época que convierte el presupuesto multi-época en una población de modelos. Esto logra una pérdida de validación menor y una eficiencia de datos hasta 12.9 veces mayor en comparación con modelos únicos.

Explorando la personalización masiva de modelos de lenguaje con la eficiencia de PEFT

Escalado de PEFT: Hacia Modelos Personales de Trillones de Parámetros

Este artículo examina el escalado de PEFT (Parameter-Efficient Fine-Tuning) para crear "millones de modelos personales" a partir de modelos base de trillones de parámetros. Se analiza cómo esta técnica permite la personalización masiva de modelos de lenguaje de gran escala, abordando los desafíos y oportunidades en la eficiencia y aplicabilidad en inteligencia artificial.

Descubre LFM2.5, la nueva familia de modelos híbridos optimizados para asistentes personales en tiempo real y rendimiento de inferencia sin precedentes.

Qué es LFM2.5-8B-A1B: Modelos Híbridos para Despliegue en Dispositivo

LFM2.5-8B-A1B es un modelo híbrido diseñado para el despliegue en dispositivos, ofreciendo rendimiento competitivo con modelos más grandes. Ideal para asistentes personales, encadenamiento de herramientas y tareas de agente, con soporte para vLLM, llama.cpp y MLX.

El grupo Heretic demuestra que las defensas multimillonarias de los LLM pueden eliminarse por el coste de un café, redefiniendo la economía del alineamiento.

La seguridad de la IA: ¿Un mito de veinte dólares?

Explora cómo el grupo Heretic desmanteló las capas de seguridad de los LLM de Meta por solo 20 dólares, exponiendo la fragilidad del alineamiento y el inmenso coste de oportunidad de la censura en modelos de producción. Un análisis de la asimetría de costes entre la construcción y la eliminación de barreras de seguridad.

Descubre el innovador marco BES que supera las limitaciones del muestreo tradicional en LLM mediante operadores evolutivos y descomposición de objetivos.

Cómo la Búsqueda Evolutiva Bidireccional mejora la automejora de los LLM

Explora la Búsqueda Evolutiva Bidireccional (BES), un nuevo enfoque que combina búsqueda hacia adelante con operadores evolutivos y búsqueda hacia atrás para descomponer objetivos. Aprende cómo BES genera muestras de alta calidad y resuelve problemas complejos que los métodos de muestreo convencionales no pueden, mejorando significativamente la automejora de los LLM.

Descubre cómo MiniCPM5-1B redefine la ejecución de modelos de lenguaje en dispositivos con recursos limitados, ofreciendo rendimiento de vanguardia y versatilidad.

MiniCPM5-1B: Un Modelo de Lenguaje de 1B de Parámetros para Ejecución Local

Explora la arquitectura, variantes y los innovadores modos duales "Think / No Think" de MiniCPM5-1B. Aprende cómo este modelo de 1B de parámetros optimizado para entornos locales puede funcionar como asistente rápido y motor de razonamiento deliberativo, ideal para agentes de codificación y flujos de trabajo con herramientas.

Un nuevo paradigma para adaptar Grandes Modelos de Lenguaje mediante la optimización de documentos de habilidades en espacio textual, sin modificar los pesos del modelo.

SkillOpt: Optimización de Habilidades para LLMs con un Enfoque de Aprendizaje Profundo

SkillOpt introduce un enfoque novedoso para la adaptación de LLMs, tratando los documentos de habilidades como estados entrenables. Utilizando un optimizador en espacio textual con controles de aprendizaje profundo, el sistema destila la experiencia de ejecución en texto reutilizable, permitiendo la adaptación de modelos cerrados y congelados a nuevos dominios.

Macaron-A2UI introduce interfaces de usuario dinámicas para mejorar la interacción con agentes de IA, superando las limitaciones del texto plano.

IU Generativa: Más Allá del Texto en Agentes de IA

Este artículo explora Macaron-A2UI, un modelo que permite a los agentes de IA generar lenguaje natural y acciones de IU ligeras. Presenta el corpus A2UI para el entrenamiento y A2UI-Bench para la evaluación estructurada, detallando un enfoque de entrenamiento en dos etapas para mejorar la capacidad de los agentes de IA para manejar interacciones complejas.

Descubre cómo esta variante comunitaria de Qwen3.5-35B-A3B combina la libertad de un modelo sin censura con la eficiencia de la Predicción Nativa de Múltiples Tokens.

Qwen3.5-35B-A3B-Heretic-V2: Un Modelo de Lenguaje Sin Censura y Eficiente

Explora las características clave de Qwen3.5-35B-A3B-Heretic-V2, un modelo de lenguaje grande sin censura impulsado por la comunidad. Aprende sobre su arquitectura de mezcla de expertos, la conservación de la predicción de múltiples tokens y los diversos formatos disponibles para su despliegue, desde GPUs en la nube hasta dispositivos personales.

xAI completa el entrenamiento de su modelo fundacional de 1,5 billones de parámetros, triplicando la escala de su predecesor y enfocándose en programación avanzada.

Grok V9-Medium Finaliza Entrenamiento, Lanzamiento en Junio

Elon Musk confirma la finalización del entrenamiento de Grok V9-Medium, el nuevo modelo de xAI con 1,5 billones de parámetros. Se espera su lanzamiento público en junio de 2026 tras las fases de fine-tuning y aprendizaje por refuerzo, con un fuerte enfoque en capacidades de programación.

Descubra cómo la compilación subterránea entrena un modelo pequeño para seguir procedimientos complejos sin orquestador, reduciendo costos y latencia.

Compilación subterránea: cómo incrustar flujos de trabajo en modelos pequeños

Aprenda a compilar flujos de trabajo en modelos de lenguaje pequeños para eliminar la orquestación superficial y reducir costos. Descubra el pipeline de compilación subterránea y cómo aplicarlo en dominios empresariales reales.