El statu quo reactivo y una alternativa proactiva
Los asistentes de IA actuales siguen siendo fundamentalmente reactivos: generan respuestas solo después de que el usuario formula una solicitud explícita, dejando sin aprovechar el tiempo de inactividad entre interacciones. Esto contrasta con el concepto psicológico de afrontamiento proactivo, donde los individuos anticipan demandas futuras y preparan recursos por adelantado.
El artículo presenta ProAct, una arquitectura de agente proactivo que transforma los intervalos de inactividad en ciclos estructurados de anticipación y aprendizaje. En lugar de esperar una petición, ProAct analiza el historial del diálogo y la memoria persistente para predecir las necesidades probables del usuario, y luego adquiere evidencia de apoyo durante las ventanas de inactividad. Un mecanismo de entrega sensible al valor garantiza que el contenido preparado se muestre solo cuando es realmente útil, evitando interrupciones irrelevantes.

Este paradigma traslada una parte sustancial del cómputo desde los picos de interacción hacia los períodos de menor actividad, con el objetivo de reducir el esfuerzo del usuario, acelerar la finalización de tareas y mejorar el fundamento factual.
Arquitectura de ProAct: predicción, adquisición y entrega
ProAct funciona mediante un ciclo cerrado que acopla las interacciones en primer plano con la preparación en segundo plano. Después de cada turno del usuario, el sistema actualiza su memoria persistente, que almacena perfiles de usuario, resúmenes de conversación, hechos sobre entidades y artefactos adquiridos previamente.
Durante el intervalo de inactividad subsiguiente, dos módulos estrechamente integrados toman el control:
- Predicción de estados futuros genera un conjunto compacto de necesidades futuras candidatas extrapolando a partir del diálogo reciente y expandiéndose hacia temas relacionados apoyados en la memoria. También incorpora señales del mantenimiento de la memoria, convirtiendo conocimiento obsoleto o faltante en objetivos de predicción.
- Adquisición en tiempo de inactividad puntúa cada candidato mediante una función de valor que equilibra la relevancia para el usuario, las lagunas de conocimiento, el valor incremental y la oportunidad temporal. Solo los candidatos con alta puntuación reciben presupuesto de búsqueda. A continuación, el módulo recupera o reutiliza evidencia, genera artefactos de conocimiento compactos con su procedencia y los almacena en la memoria.
Una política de entrega consciente de la utilidad decide si cada artefacto debe enviarse inmediatamente al usuario, ponerse en cola para integrarlo en una respuesta posterior o almacenarse silenciosamente para uso futuro. Este filtro evita que el trabajo proactivo abrume al usuario con contenido de bajo valor.

Formalización del comportamiento proactivo del agente
La interacción proactiva se formula como un problema de decisión en ciclo cerrado. Sea el historial del diálogo hasta el turno y el estado de la memoria persistente. Durante una ventana de inactividad con presupuesto , el predictor genera un conjunto de necesidades futuras candidatas:
Cada candidato se representa como : la necesidad anticipada, la justificación de su fundamento, la confianza y el plan de recuperación.
La política proactiva selecciona candidatos, asigna presupuesto y asigna decisiones de entrega para maximizar la utilidad futura esperada bajo restricciones de interrupción, presupuesto y alucinaciones. Dado que la utilidad posterior no es observable en el momento de inactividad, ProAct emplea una puntuación de valor a nivel de candidato para decidir la adquisición:
donde es la relevancia para el usuario, la laguna de conocimiento, el valor incremental y la oportunidad temporal. Solo los candidatos con pasan a la fase de adquisición de evidencia. Este mecanismo de puntuación vincula directamente la predicción con la asignación de recursos, asegurando que el cómputo en tiempo de inactividad se invierta únicamente en preparación de alto valor.
ProActEval: un benchmark para la asistencia proactiva
Evaluar agentes proactivos exige algo más que probar la respuesta a preguntas de forma reactiva. Los autores presentan ProActEval, un benchmark integral con 200 escenarios en 40 dominios. Cada escenario contiene una ficha de hechos autocontenida sobre entidades ficticias y una secuencia ordenada de necesidades del usuario con anotaciones explícitas de predictibilidad.
Características clave del diseño:
- Las necesidades se organizan en grupos de revelación con enlaces
predictable_after, formando un grafo de necesidades del usuario que el asistente nunca ve. - Los escenarios abarcan cinco arquetipos cognitivos (p. ej., Memoria fundacional, Razonamiento de trazas y dependencias) para cubrir demandas anticipatorias diversas.
- Un simulador de usuario recorre la secuencia de necesidades, omitiendo aquellas ya cubiertas de forma proactiva, lo que traduce la anticipación en una reducción del esfuerzo del usuario.
Las métricas de evaluación incluyen y (turnos para alcanzar el 80 % y el 100 % de cobertura de necesidades imprescindibles), Esfuerzo del usuario (turnos explícitos del usuario), Precisión factual, Tasa de alucinaciones y Recall de anticipación. Un juez basado en LLM evalúa la corrección factual y la cobertura sin acceso a los metadatos de referencia.
Ganancias proactivas: eficiencia, cobertura e integridad factual
En ProActEval, la configuración completa Directed Idle (cómputo en inactividad guiado por predicción) supera sustancialmente tanto a la línea base reactiva como a una variante de inactividad no dirigida.
| Métrica | Reactivo | Inactividad no dirigida | Inactividad dirigida | vs. Reactivo |
|---|---|---|---|---|
| 8.110 | 8.040 | 6.910 | –14.8% | |
| Esfuerzo del usuario | 9.140 | 9.040 | 8.075 | –11.7% |
| Tasa de alucinaciones | 0.132 | 0.124 | 0.095 | –28.1% |
| Recall de anticipación | 0.000 | 0.000 | 0.428 | +0.428 |
El estudio de ablación revela que la búsqueda en segundo plano no dirigida por sí sola produce mejoras insignificantes, mientras que la dirección predictiva impulsa las ganancias. En comparación con una línea base adaptada de ProactiveAgent, ProAct anticipa 703 de 1,572 necesidades predecibles (recall 0.447) frente a solo 32 (0.020), lo que demuestra que el comportamiento proactivo debe estar orientado a las necesidades relevantes del benchmark para reducir el esfuerzo del usuario.
Memoria central y el costo de la búsqueda en tiempo de inactividad
La capa de memoria de ProAct alcanza una precisión reflexiva de vanguardia en MemBench: 84.3 % con 10k tokens y 86.3 % con 100k tokens, superando sistemas anteriores como MemGPT y MemoryBank. Esta memoria robusta a largo plazo es esencial para fundamentar las predicciones sobre estados futuros.
Un análisis del presupuesto de búsqueda en un subconjunto de 50 escenarios revela un claro compromiso entre costo y eficiencia. Aumentar el presupuesto de búsqueda en inactividad de 4 a 16 eleva la Exhaustividad de anticipación de 0.253 a 0.432, pero y el Esfuerzo del Usuario no mejoran de forma monótona. Una vez cubiertas las necesidades predecibles principales, las búsquedas adicionales persiguen necesidades de menor utilidad marginal y pueden alterar la trayectoria de la conversación en ciclo cerrado, a veces incluso degradando la eficiencia global.

En cada presupuesto emparejado, la Inactividad Dirigida supera a la No Dirigida, lo que confirma que la orientación predictiva mejora la utilidad del cómputo en tiempo de inactividad más allá del simple volumen de búsqueda. El presupuesto debe tratarse como un punto de operación, no como un parámetro a maximizar.
Conclusión y perspectivas
ProAct demuestra que el cómputo en tiempo de inactividad, guiado por la predicción de estados futuros y respaldado por una memoria persistente, puede mejorar significativamente la asistencia proactiva: reduce los turnos de interacción, disminuye el esfuerzo del usuario y recorta las alucinaciones. El punto de referencia ProActEval ofrece un marco riguroso para medir estas capacidades a lo largo de diversas cadenas de necesidades predecibles.
El trabajo también señala limitaciones importantes. Los resultados se obtienen en un punto de referencia sintético de mundo cerrado; los despliegues en el mundo real requerirían controles de usuario, límites de frecuencia y salvaguardas de privacidad. La preparación proactiva puede ocasionalmente resultar contraproducente, compitiendo con respuestas reactivas o promoviendo contenido de bajo valor. El análisis del presupuesto subraya que más búsqueda en inactividad no garantiza mejores resultados: una asistencia proactiva eficiente depende de una predicción precisa de necesidades y de un filtro de entrega consciente del valor.
Cuando se aplican con los controles adecuados, los agentes proactivos podrían reducir la búsqueda repetitiva de información, ayudar a los usuarios a prepararse para seguimientos previsibles y mejorar la fundamentación factual al adquirir evidencia antes de que se necesiten respuestas apresuradas. Esta investigación abre el camino hacia asistentes de IA que anticipan y aprenden activamente, en lugar de limitarse a reaccionar.



