LLM

Page 1 of 2

¿Cuándo pedir aclaraciones? El momento clave en agentes de IA de largo plazo
Estudio revela cuándo pedir aclaraciones maximiza el rendimiento en agentes de IA con tareas de largo horizonte

¿Cuándo pedir aclaraciones? El momento clave en agentes de IA de largo plazo

6,000 ejecuciones revelan que el momento de pedir aclaraciones es crítico en agentes de IA: las de objetivo pierden valor tras el 10%, las de entrada hasta el 50%, y deferir más allá de la mitad empeora el rendimiento. Ningún modelo actual pregunta en la ventana óptima.

Pruebas Verificables para la Auditoría de Agentes de IA en Solana
Cómo asegurar la transparencia e integridad de agentes de inteligencia artificial con pruebas criptográficas en Solana

Pruebas Verificables para la Auditoría de Agentes de IA en Solana

Exploramos el uso de pruebas verificables en la blockchain de Solana para auditar agentes de IA, garantizando transparencia, integridad y confianza en sistemas descentralizados de inteligencia artificial.

Grok Build Beta: La nueva CLI de xAI para agentes de IA
Acceso anticipado a la interfaz de línea de comandos rápida y sin parpadeos para suscriptores de SuperGrok Heavy

Grok Build Beta: La nueva CLI de xAI para agentes de IA

xAI lanza Grok Build Beta, una CLI que coordina múltiples agentes para planificar, ejecutar subagentes y trabajar en paralelo. Incluye habilidades adaptativas, visor de planes, mercados y comandos especiales. Disponible para suscriptores de SuperGrok Heavy.

Grok prepara 'Skills': plantillas reutilizables para automatizar tareas
La función permitirá guardar instrucciones modulares y compartibles, compitiendo con Anthropic y OpenAI

Grok prepara 'Skills': plantillas reutilizables para automatizar tareas

La próxima función Skills de Grok (xAI) permitirá crear y reutilizar plantillas de instrucciones para automatizar tareas. Filtraciones muestran campos para nombre, descripción e instrucción, y soporte para archivos .zip, .skill y .md. Se espera que compita con sistemas similares de Anthropic y OpenAI.