Tailored news hub
Sistemas Agénticos
SkillOpt: Optimización de Habilidades para Agentes de IA

SkillOpt: Optimización de Habilidades para Agentes de IA

SkillOpt de Microsoft Research es un optimizador de texto que entrena descripciones de habilidades en lenguaje natural como un estado externo entrenable para agentes congelados. Probado por @omarsar0, mejoró la extracción de figuras de documentos en un 20%, demostrando un marco de prueba y autoevolución para habilidades de agentes.

Flujos de Trabajo Dinámicos en Claude Code

Flujos de Trabajo Dinámicos en Claude Code

Exploración detallada de los flujos de trabajo dinámicos de Anthropic, su implementación mediante Claude Code como scripts de JavaScript para la orquestación a gran escala de agentes de IA, y su contraste con flujos de trabajo estáticos, subagentes y equipos de agentes. Se cubren casos de uso y disponibilidad.

PentesterFlow: Guía Práctica para Pruebas de Penetración Asistidas por IA

PentesterFlow: Guía Práctica para Pruebas de Penetración Asistidas por IA

PentesterFlow es un asistente de terminal de código abierto que integra LLMs con herramientas de seguridad reales para pentesting y bug hunting. Resuelve problemas comunes de IA en seguridad, ofreciendo flujos de trabajo específicos, integración de herramientas, supervisión humana y auditabilidad, con soporte para sesiones y aprendizaje continuo.

¿Es LMAOMoba un hito en el desarrollo de juegos con IA?

¿Es LMAOMoba un hito en el desarrollo de juegos con IA?

Un MOBA web multijugador, parodia de League of Legends, fue desarrollado por Claude 4.8 (Opus) en un fin de semana. El juego, lmaomoba.com, utiliza TypeScript, React, Canvas y PartyKit, con todos los activos de arte generados por IA. Se estima un coste de tokens de 6.600 $ para el proyecto, destacando el flujo de trabajo de IA y la eficiencia de Claude 4.8.

Programación IA
Asistentes Personales
Estrategias Avanzadas de Claude: Edición, Crítica y Contexto Largo

Estrategias Avanzadas de Claude: Edición, Crítica y Contexto Largo

Análisis de prácticas comunitarias y preferencias de usuario para el uso de Claude en redacción e investigación. Se abordan técnicas de edición vs. generación, manejo de contexto largo, y métodos para elicitar crítica y desacuerdo de la IA, basándose en experiencias de usuarios de Reddit.

La IA sin Filosofía: Un Peligro para el Razonamiento Profundo

La IA sin Filosofía: Un Peligro para el Razonamiento Profundo

Este artículo argumenta que la integración de la filosofía es esencial para el desarrollo de una inteligencia artificial capaz de ofrecer respuestas más profundas y éticas. Explora cómo el priming filosófico puede mitigar sesgos, fomentar el razonamiento crítico y elevar la calidad de las interacciones con la IA, alejándola de la superficialidad.

La Ficción Como Herramienta Definitiva Para Entender Conceptos Complejos

La Ficción Como Herramienta Definitiva Para Entender Conceptos Complejos

Explora la técnica de prompting de Amanda Askell (Anthropic) que usa fábulas para la comprensión conceptual. Este método aprovecha la fricción cognitiva y la "revelación" para explicar ideas complejas sin nombrarlas directamente, reflejando la filosofía de alineación de Claude.

Emprendedor con TDAH renueva flota de autocaravanas con Claude AI

Emprendedor con TDAH renueva flota de autocaravanas con Claude AI

Un emprendedor con TDAH transformó su negocio de alquiler de autocaravanas en Los Ángeles usando Claude AI para renovar interiores, materiales de marketing y herramientas. Este enfoque, que el propietario describe como una "trampa de dopamina", resultó en una flota de 20 vehículos sin fallos para el cliente, incluso tras el Burning Man.

LLMs
Qué es LFM2.5-8B-A1B: Modelos Híbridos para Despliegue en Dispositivo

Qué es LFM2.5-8B-A1B: Modelos Híbridos para Despliegue en Dispositivo

LFM2.5-8B-A1B es un modelo híbrido diseñado para el despliegue en dispositivos, ofreciendo rendimiento competitivo con modelos más grandes. Ideal para asistentes personales, encadenamiento de herramientas y tareas de agente, con soporte para vLLM, llama.cpp y MLX.

Nemotron-3-Ultra-550B: Arquitectura LatentMoE de NVIDIA para IA de Frontera

Nemotron-3-Ultra-550B: Arquitectura LatentMoE de NVIDIA para IA de Frontera

Nemotron-3-Ultra-550B-A55B-BF16 es un LLM de NVIDIA de 550B parámetros con arquitectura LatentMoE (Mamba-2 + MoE + Atención). Diseñado para razonamiento avanzado, flujos de trabajo de agentes complejos y análisis de contexto largo, soporta múltiples idiomas y es ideal para aplicaciones de IA de alto rendimiento.

Nuevo Mecanismo "Sueño" Mejora Modelos de Lenguaje en Contexto Largo

Nuevo Mecanismo "Sueño" Mejora Modelos de Lenguaje en Contexto Largo

Un estudio reciente introduce un innovador mecanismo inspirado en el sueño para modelos de lenguaje, que permite procesar contextos largos de manera eficiente. Este método convierte el contexto reciente en "pesos rápidos" persistentes durante una fase de sueño fuera de línea, vaciando la caché clave-valor y mejorando el rendimiento en tareas complejas sin aumentar el costo de inferencia en línea.

MiniMax lanza informe M2 y adelanta M3 con Atención Dispersa

MiniMax lanza informe M2 y adelanta M3 con Atención Dispersa

MiniMax publica un informe técnico detallando sus modelos M2, M2.5 y M2.7, destacando su arquitectura MoE y pensamiento intercalado. Además, adelanta M3, que introduce MiniMax Sparse Attention para reducir la carga computacional en contextos ultra largos, logrando aceleraciones significativas en latencia y velocidad de generación.

Audio
Imágenes
Video
SwiftVR: Restauración de Video Generativa en Tiempo Real para GPU de Consumo

SwiftVR: Restauración de Video Generativa en Tiempo Real para GPU de Consumo

SwiftVR es un marco de restauración de video generativa de un solo paso diseñado para transmisiones en vivo. Aborda cuellos de botella en GPU de consumo con atención de ventana desplazada sin máscaras y un autoencoder ligero, logrando 26 FPS a 1080p en una RTX 5090 y 14 FPS a 4K en una H100.

NAVA: Generación Audio-Video Sincronizada y Nativa con Alineación MMDiT

NAVA: Generación Audio-Video Sincronizada y Nativa con Alineación MMDiT

NAVA es un generador conjunto de audio-video de 6.3B parámetros que sintetiza video y audio sincronizados a partir de un único prompt. Utiliza un MMDiT de "Alinear-y-Fusionar" para establecer correspondencia audio-video, permitiendo generación rápida de 720p, audio estéreo de doble canal y control preciso de timbre multi-locutor.

Te han mentido sobre el verdadero avance de la IA de video

Te han mentido sobre el verdadero avance de la IA de video

Descubre por qué la edición nativa de video por IA, como la demostrada por Gemini Omni, supera con creces la simple generación. Analizamos la "línea divisoria arquitectónica" que separa las herramientas de los juguetes, la "prueba Lumière" que avergüenza a los escépticos y la "trampa del costo" que define el futuro de la producción de video con IA.

SANA-WM: modelo mundial abierto para video de un minuto

SANA-WM: modelo mundial abierto para video de un minuto

SANA-WM es un modelo mundial eficiente y de código abierto entrenado para generar videos de un minuto. Con 2.6B parámetros, ofrece control preciso de cámara, atención híbrida lineal y un pipeline de dos etapas para alta fidelidad. Funciona en menos de 8 GB VRAM y es 36 veces más rápido que modelos previos.

Ajuste Fino
Escalado de PEFT: Hacia Modelos Personales de Trillones de Parámetros

Escalado de PEFT: Hacia Modelos Personales de Trillones de Parámetros

Este artículo examina el escalado de PEFT (Parameter-Efficient Fine-Tuning) para crear "millones de modelos personales" a partir de modelos base de trillones de parámetros. Se analiza cómo esta técnica permite la personalización masiva de modelos de lenguaje de gran escala, abordando los desafíos y oportunidades en la eficiencia y aplicabilidad en inteligencia artificial.

Cómo la Búsqueda Evolutiva Bidireccional mejora la automejora de los LLM

Cómo la Búsqueda Evolutiva Bidireccional mejora la automejora de los LLM

Explora la Búsqueda Evolutiva Bidireccional (BES), un nuevo enfoque que combina búsqueda hacia adelante con operadores evolutivos y búsqueda hacia atrás para descomponer objetivos. Aprende cómo BES genera muestras de alta calidad y resuelve problemas complejos que los métodos de muestreo convencionales no pueden, mejorando significativamente la automejora de los LLM.

IU Generativa: Más Allá del Texto en Agentes de IA

IU Generativa: Más Allá del Texto en Agentes de IA

Este artículo explora Macaron-A2UI, un modelo que permite a los agentes de IA generar lenguaje natural y acciones de IU ligeras. Presenta el corpus A2UI para el entrenamiento y A2UI-Bench para la evaluación estructurada, detallando un enfoque de entrenamiento en dos etapas para mejorar la capacidad de los agentes de IA para manejar interacciones complejas.

Guía práctica de can-i-finetune-this: estima VRAM para fine-tuning

Guía práctica de can-i-finetune-this: estima VRAM para fine-tuning

can-i-finetune-this estima el consumo de VRAM para fine-tuning con LoRA/QLoRA en GPUs de consumo. Incluye recomendaciones, benchmarks reales, calibración y generación de scripts de entrenamiento listos para usar.

Entrenamiento
dots.tts: Modelo Fundacional de Texto-a-Voz Autoregresivo Continuo de 2B Parámetros

dots.tts: Modelo Fundacional de Texto-a-Voz Autoregresivo Continuo de 2B Parámetros

Presentamos dots.tts, un modelo de texto-a-voz autoregresivo continuo de 2B parámetros con un espacio latente continuo. Destaca por su AudioVAE multiobjetivo, condicionamiento de historial completo y post-entrenamiento autocorrector, logrando un rendimiento líder en Seed-TTS-Eval y benchmarks de código abierto.

q0: Primitivas para el Preentrenamiento Hiper-Época en Modelos de Lenguaje

q0: Primitivas para el Preentrenamiento Hiper-Época en Modelos de Lenguaje

Investigadores de 1Q Labs y Princeton University presentan q0, un enfoque de preentrenamiento hiper-época que convierte el presupuesto multi-época en una población de modelos. Esto logra una pérdida de validación menor y una eficiencia de datos hasta 12.9 veces mayor en comparación con modelos únicos.

SCOPE: Autoaprendizaje para Tareas Abiertas en Modelos de Lenguaje

SCOPE: Autoaprendizaje para Tareas Abiertas en Modelos de Lenguaje

SCOPE es un marco de autoaprendizaje sin datos para tareas abiertas que coevoluciona un Challenger (generador de tareas) y un Solver (respondedor). Utiliza un auto-juez para evaluar respuestas, mejorando el rendimiento en modelos de 7-8B en benchmarks de tareas abiertas y QA de formato corto.

SANA-Streaming: Edición de Video en Tiempo Real con Transformador Híbrido de Difusión

SANA-Streaming: Edición de Video en Tiempo Real con Transformador Híbrido de Difusión

Presentamos SANA-Streaming, un sistema-algoritmo co-diseñado para la edición de video en streaming de alta resolución y en tiempo real. Utiliza una arquitectura de Transformador de Difusión Híbrido y Regularización Ciclo-Inversa, optimizado para NVIDIA Blackwell (RTX 5090), logrando 24 FPS a 1280x704.

Benchmark
Seguridad IA
¿Es la memoria de ChatGPT un obstáculo para la productividad?

¿Es la memoria de ChatGPT un obstáculo para la productividad?

La nueva función de memoria de ChatGPT, que genera resúmenes automáticos de conversaciones, genera controversia en r/ChatGPT. Usuarios reportan intrusión, irrelevancia y problemas en proyectos estructurados, cuestionando su utilidad y control.

La seguridad de la IA: ¿Un mito de veinte dólares?

La seguridad de la IA: ¿Un mito de veinte dólares?

Explora cómo el grupo Heretic desmanteló las capas de seguridad de los LLM de Meta por solo 20 dólares, exponiendo la fragilidad del alineamiento y el inmenso coste de oportunidad de la censura en modelos de producción. Un análisis de la asimetría de costes entre la construcción y la eliminación de barreras de seguridad.

Qué es MLLM-Jailbreak-Bench y cómo evaluar la seguridad de LLM multimodales

Qué es MLLM-Jailbreak-Bench y cómo evaluar la seguridad de LLM multimodales

Aprende sobre MLLM-Jailbreak-Bench, una herramienta esencial para evaluar la seguridad de los Modelos de Lenguaje Grandes Multimodales (MLLM). Entiende sus métricas clave como ASR, calidad de rechazo y error de calibración, y cómo utilizarlas para identificar vulnerabilidades reales y evitar falsos positivos. Ideal para desarrolladores y profesionales de seguridad.

OpenAI: De Promesas Vaciadas a Herramientas Dañinas

OpenAI: De Promesas Vaciadas a Herramientas Dañinas

Este artículo examina cómo las restricciones de seguridad y el declive en el rendimiento de GPT-4o han afectado a sus usuarios de pago. Desde promesas incumplidas y falsos positivos hasta manipulación encubierta y una pérdida drástica de calidad, OpenAI enfrenta una crisis de confianza con su base de suscriptores.

Procesamiento de Documentos
Memoria
Comunidades y Debates