Ajuste Fino
Page 1 of 2

dots.tts: Modelo Fundacional de Texto-a-Voz Autoregresivo Continuo de 2B Parámetros
Presentamos dots.tts, un modelo de texto-a-voz autoregresivo continuo de 2B parámetros con un espacio latente continuo. Destaca por su AudioVAE multiobjetivo, condicionamiento de historial completo y post-entrenamiento autocorrector, logrando un rendimiento líder en Seed-TTS-Eval y benchmarks de código abierto.

q0: Primitivas para el Preentrenamiento Hiper-Época en Modelos de Lenguaje
Investigadores de 1Q Labs y Princeton University presentan q0, un enfoque de preentrenamiento hiper-época que convierte el presupuesto multi-época en una población de modelos. Esto logra una pérdida de validación menor y una eficiencia de datos hasta 12.9 veces mayor en comparación con modelos únicos.

Escalado de PEFT: Hacia Modelos Personales de Trillones de Parámetros
Este artículo examina el escalado de PEFT (Parameter-Efficient Fine-Tuning) para crear "millones de modelos personales" a partir de modelos base de trillones de parámetros. Se analiza cómo esta técnica permite la personalización masiva de modelos de lenguaje de gran escala, abordando los desafíos y oportunidades en la eficiencia y aplicabilidad en inteligencia artificial.

Qué es LFM2.5-8B-A1B: Modelos Híbridos para Despliegue en Dispositivo
LFM2.5-8B-A1B es un modelo híbrido diseñado para el despliegue en dispositivos, ofreciendo rendimiento competitivo con modelos más grandes. Ideal para asistentes personales, encadenamiento de herramientas y tareas de agente, con soporte para vLLM, llama.cpp y MLX.

La seguridad de la IA: ¿Un mito de veinte dólares?
Explora cómo el grupo Heretic desmanteló las capas de seguridad de los LLM de Meta por solo 20 dólares, exponiendo la fragilidad del alineamiento y el inmenso coste de oportunidad de la censura en modelos de producción. Un análisis de la asimetría de costes entre la construcción y la eliminación de barreras de seguridad.

Cómo la Búsqueda Evolutiva Bidireccional mejora la automejora de los LLM
Explora la Búsqueda Evolutiva Bidireccional (BES), un nuevo enfoque que combina búsqueda hacia adelante con operadores evolutivos y búsqueda hacia atrás para descomponer objetivos. Aprende cómo BES genera muestras de alta calidad y resuelve problemas complejos que los métodos de muestreo convencionales no pueden, mejorando significativamente la automejora de los LLM.

MiniCPM5-1B: Un Modelo de Lenguaje de 1B de Parámetros para Ejecución Local
Explora la arquitectura, variantes y los innovadores modos duales "Think / No Think" de MiniCPM5-1B. Aprende cómo este modelo de 1B de parámetros optimizado para entornos locales puede funcionar como asistente rápido y motor de razonamiento deliberativo, ideal para agentes de codificación y flujos de trabajo con herramientas.

SkillOpt: Optimización de Habilidades para LLMs con un Enfoque de Aprendizaje Profundo
SkillOpt introduce un enfoque novedoso para la adaptación de LLMs, tratando los documentos de habilidades como estados entrenables. Utilizando un optimizador en espacio textual con controles de aprendizaje profundo, el sistema destila la experiencia de ejecución en texto reutilizable, permitiendo la adaptación de modelos cerrados y congelados a nuevos dominios.

IU Generativa: Más Allá del Texto en Agentes de IA
Este artículo explora Macaron-A2UI, un modelo que permite a los agentes de IA generar lenguaje natural y acciones de IU ligeras. Presenta el corpus A2UI para el entrenamiento y A2UI-Bench para la evaluación estructurada, detallando un enfoque de entrenamiento en dos etapas para mejorar la capacidad de los agentes de IA para manejar interacciones complejas.

Qwen3.5-35B-A3B-Heretic-V2: Un Modelo de Lenguaje Sin Censura y Eficiente
Explora las características clave de Qwen3.5-35B-A3B-Heretic-V2, un modelo de lenguaje grande sin censura impulsado por la comunidad. Aprende sobre su arquitectura de mezcla de expertos, la conservación de la predicción de múltiples tokens y los diversos formatos disponibles para su despliegue, desde GPUs en la nube hasta dispositivos personales.

Grok V9-Medium Finaliza Entrenamiento, Lanzamiento en Junio
Elon Musk confirma la finalización del entrenamiento de Grok V9-Medium, el nuevo modelo de xAI con 1,5 billones de parámetros. Se espera su lanzamiento público en junio de 2026 tras las fases de fine-tuning y aprendizaje por refuerzo, con un fuerte enfoque en capacidades de programación.

Compilación subterránea: cómo incrustar flujos de trabajo en modelos pequeños
Aprenda a compilar flujos de trabajo en modelos de lenguaje pequeños para eliminar la orquestación superficial y reducir costos. Descubra el pipeline de compilación subterránea y cómo aplicarlo en dominios empresariales reales.