Académico

Page 2 of 3

Un nuevo paradigma para adaptar Grandes Modelos de Lenguaje mediante la optimización de documentos de habilidades en espacio textual, sin modificar los pesos del modelo.

SkillOpt: Optimización de Habilidades para LLMs con un Enfoque de Aprendizaje Profundo

SkillOpt introduce un enfoque novedoso para la adaptación de LLMs, tratando los documentos de habilidades como estados entrenables. Utilizando un optimizador en espacio textual con controles de aprendizaje profundo, el sistema destila la experiencia de ejecución en texto reutilizable, permitiendo la adaptación de modelos cerrados y congelados a nuevos dominios.

Macaron-A2UI introduce interfaces de usuario dinámicas para mejorar la interacción con agentes de IA, superando las limitaciones del texto plano.

IU Generativa: Más Allá del Texto en Agentes de IA

Este artículo explora Macaron-A2UI, un modelo que permite a los agentes de IA generar lenguaje natural y acciones de IU ligeras. Presenta el corpus A2UI para el entrenamiento y A2UI-Bench para la evaluación estructurada, detallando un enfoque de entrenamiento en dos etapas para mejorar la capacidad de los agentes de IA para manejar interacciones complejas.

Un nuevo paradigma para asistentes de IA que transforman el tiempo de inactividad en preparación proactiva, mejorando la eficiencia y la precisión.

ProAct: Asistentes de IA Proactivos que Anticipan Necesidades del Usuario

Descubre ProAct, una arquitectura de agente de IA que utiliza el tiempo de inactividad para predecir y adquirir información relevante antes de que el usuario la solicite. Este enfoque proactivo reduce el esfuerzo del usuario, acelera la finalización de tareas y mejora la fundamentación factual, evaluado con el nuevo benchmark ProActEval.

Una nueva fase de consolidación fuera de línea permite a los modelos de lenguaje híbridos superar las limitaciones de razonamiento secuencial profundo.

El "Sueño" de los LLM: Consolidación de Memoria para Razonamiento Profundo

Exploramos cómo la consolidación de memoria inspirada en el sueño biológico mejora la capacidad de razonamiento de los modelos de lenguaje grandes. Este enfoque permite que los LLM conviertan el contexto transitorio en pesos persistentes, superando los límites de los modelos híbridos tradicionales en tareas de cómputo secuencial profundo.

Análisis de la imposibilidad de generar un resumen preciso sin el texto completo de un artículo científico o editorial.

Falta de Contenido en Artículo: Implicaciones para la Síntesis Editorial

Este documento aborda la necesidad crítica de disponer del contenido completo de un artículo (resumen, método, resultados, figuras) para poder elaborar una síntesis editorial precisa y basada en evidencia. Se destaca que la ausencia de estos elementos imposibilita una comprensión adecuada del trabajo.

Un estudio sistemático revela el fenómeno de 'decaimiento de restricciones' y su impacto en la generación de código funcional y estructuralmente correcto

Cómo la acumulación de restricciones estructurales debilita a los agentes LLM en la generación de código backend

Este artículo analiza cómo los agentes basados en grandes modelos de lenguaje (LLM) fallan al generar código backend cuando se acumulan requisitos estructurales como patrones arquitectónicos y mapeos objeto-relacionales. Aprenderás sobre el fenómeno de 'constraint decay', las diferencias entre frameworks como Flask y Django, y las principales causas de error en la capa de datos.

Un transformador de difusión bidireccional de 2.6B parámetros genera video 720p con control de cámara 6-DoF

SANA-WM: modelo mundial abierto para video de un minuto

SANA-WM es un modelo mundial eficiente y de código abierto entrenado para generar videos de un minuto. Con 2.6B parámetros, ofrece control preciso de cámara, atención híbrida lineal y un pipeline de dos etapas para alta fidelidad. Funciona en menos de 8 GB VRAM y es 36 veces más rápido que modelos previos.

Análisis de las visiones de la Comisión Europea, el Reino Unido, la OCDE y la industria sobre el liderazgo en IA, la regulación y la cooperación internacional.

Soberanía digital europea: el camino entre EE.UU. y China en inteligencia artificial

Un panel de expertos debate la estrategia europea de IA: soberanía digital, la tercera vía entre monopolio estadounidense y democratización china, el impacto del AI Act, la colaboración UK-UE y la necesidad de actuar con rapidez para competir en el ámbito global.

Optimizaciones de entrenamiento e inferencia con cuantización NVFP4 y paralelismo de secuencia para generación de video de alta calidad y tiempo real

LongLive-2.0: Infraestructura paralela NVFP4 para video largo

LongLive-2.0 presenta un sistema de infraestructura paralela basada en NVFP4 para la generación de video largo, con entrenamiento AR paralelo, cuantización W4A4 y KV cache, y decodificación asíncrona, logrando hasta 2.1× de aceleración en entrenamiento y 45.7 FPS en inferencia, manteniendo alta calidad.

Mientras Sam Altman anunciaba restricciones relajadas, los usuarios enfrentan censura absurda, modelos inferiores y promesas incumplidas

OpenAI traiciona a sus usuarios: la libertad prometida fue un espejismo

Análisis del histórico anuncio de OpenAI en octubre 2025, la respuesta de los usuarios ante restricciones no relajadas, la retirada de GPT-4o, el estudio de sycophancy de Stanford y la migración a competidores. Un archivo de promesas rotas.

Un error matemático en Chile y datos de precios eléctricos revelan la verdad detrás de las acusaciones

El mito del consumo desmedido de los centros de datos

Analizamos cómo un error de cálculo sobre el agua en Cerrillos y las estadísticas de tarifas eléctricas en EE.UU. demuestran que los centros de datos no son los principales responsables del aumento en facturas ni de la escasez hídrica. La realidad es más compleja y favorable a la eficiencia.

Estudio revela cuándo pedir aclaraciones maximiza el rendimiento en agentes de IA con tareas de largo horizonte

¿Cuándo pedir aclaraciones? El momento clave en agentes de IA de largo plazo

6,000 ejecuciones revelan que el momento de pedir aclaraciones es crítico en agentes de IA: las de objetivo pierden valor tras el 10%, las de entrada hasta el 50%, y deferir más allá de la mitad empeora el rendimiento. Ningún modelo actual pregunta en la ventana óptima.