LLM
Page 1 of 7

SwiftVR: Restauración de Video Generativa en Tiempo Real para GPU de Consumo
SwiftVR es un marco de restauración de video generativa de un solo paso diseñado para transmisiones en vivo. Aborda cuellos de botella en GPU de consumo con atención de ventana desplazada sin máscaras y un autoencoder ligero, logrando 26 FPS a 1080p en una RTX 5090 y 14 FPS a 4K en una H100.

mnemo: Capa de Memoria Local-First para LLMs
mnemo es una capa de memoria local-first para cualquier LLM, resolviendo la pérdida de contexto entre sesiones. Ofrece memoria persistente y estructurada sin dependencia de la nube, utilizando un grafo de conocimiento en SQLite y un servicio sidecar para la extracción y recuperación de entidades.

dots.tts: Modelo Fundacional de Texto-a-Voz Autoregresivo Continuo de 2B Parámetros
Presentamos dots.tts, un modelo de texto-a-voz autoregresivo continuo de 2B parámetros con un espacio latente continuo. Destaca por su AudioVAE multiobjetivo, condicionamiento de historial completo y post-entrenamiento autocorrector, logrando un rendimiento líder en Seed-TTS-Eval y benchmarks de código abierto.

q0: Primitivas para el Preentrenamiento Hiper-Época en Modelos de Lenguaje
Investigadores de 1Q Labs y Princeton University presentan q0, un enfoque de preentrenamiento hiper-época que convierte el presupuesto multi-época en una población de modelos. Esto logra una pérdida de validación menor y una eficiencia de datos hasta 12.9 veces mayor en comparación con modelos únicos.

SkillOpt: Optimización de Habilidades para Agentes de IA
SkillOpt de Microsoft Research es un optimizador de texto que entrena descripciones de habilidades en lenguaje natural como un estado externo entrenable para agentes congelados. Probado por @omarsar0, mejoró la extracción de figuras de documentos en un 20%, demostrando un marco de prueba y autoevolución para habilidades de agentes.

Flujos de Trabajo Dinámicos en Claude Code
Exploración detallada de los flujos de trabajo dinámicos de Anthropic, su implementación mediante Claude Code como scripts de JavaScript para la orquestación a gran escala de agentes de IA, y su contraste con flujos de trabajo estáticos, subagentes y equipos de agentes. Se cubren casos de uso y disponibilidad.

Experimento de Generación de Imágenes IA con Prompts de Emojis en r/ChatGPT
Un usuario de r/ChatGPT comparte un experimento de generación de imágenes IA utilizando únicamente prompts de emojis, obteniendo resultados "sorprendentemente buenos". La publicación incluye ejemplos de prompts y la respuesta del AutoModerator con instrucciones para la comunidad.

PentesterFlow: Guía Práctica para Pruebas de Penetración Asistidas por IA
PentesterFlow es un asistente de terminal de código abierto que integra LLMs con herramientas de seguridad reales para pentesting y bug hunting. Resuelve problemas comunes de IA en seguridad, ofreciendo flujos de trabajo específicos, integración de herramientas, supervisión humana y auditabilidad, con soporte para sesiones y aprendizaje continuo.

SCOPE: Autoaprendizaje para Tareas Abiertas en Modelos de Lenguaje
SCOPE es un marco de autoaprendizaje sin datos para tareas abiertas que coevoluciona un Challenger (generador de tareas) y un Solver (respondedor). Utiliza un auto-juez para evaluar respuestas, mejorando el rendimiento en modelos de 7-8B en benchmarks de tareas abiertas y QA de formato corto.

¿Es LMAOMoba un hito en el desarrollo de juegos con IA?
Un MOBA web multijugador, parodia de League of Legends, fue desarrollado por Claude 4.8 (Opus) en un fin de semana. El juego, lmaomoba.com, utiliza TypeScript, React, Canvas y PartyKit, con todos los activos de arte generados por IA. Se estima un coste de tokens de 6.600 $ para el proyecto, destacando el flujo de trabajo de IA y la eficiencia de Claude 4.8.

Cómo ProwlFi Otorga Confidencialidad a Agentes IA en Solana
ProwlFi proporciona infraestructura para agentes IA basados en Solana, ofreciendo confidencialidad transaccional sin sacrificar la auditabilidad. Combina direcciones sigilosas de un solo uso con pagos HTTP x402 para que cada pago llegue a una dirección fresca e inenlazable, mientras el operador conserva una clave de visualización para un rastro de auditoría privado y completo.

Escalado de PEFT: Hacia Modelos Personales de Trillones de Parámetros
Este artículo examina el escalado de PEFT (Parameter-Efficient Fine-Tuning) para crear "millones de modelos personales" a partir de modelos base de trillones de parámetros. Se analiza cómo esta técnica permite la personalización masiva de modelos de lenguaje de gran escala, abordando los desafíos y oportunidades en la eficiencia y aplicabilidad en inteligencia artificial.