Harness
Page 1 of 1

Un nuovo approccio nell'apprendimento per rinforzo che utilizza "harness" per gestire stati esterni, migliorando l'efficienza e la generalizzazione.
Harness-1: Reinforcement Learning per Agenti di Ricerca con Esternazione di Stato
Presentazione di Harness-1, un sistema di Reinforcement Learning che impiega "harness" per permettere agli agenti di ricerca di esternalizzare il proprio stato, ottimizzando le prestazioni e la gestione delle informazioni.

Un nuovo approccio che ottimizza gli agenti LLM congelati tramite l'adattamento del harness runtime, migliorando le prestazioni senza modificare i pesi del modello o gli ambienti di valutazione.
Life-Harness: Adattamento dell'Interfaccia per Agenti LLM Deterministici
Presentato Life-Harness, un harness runtime consapevole del ciclo di vita che migliora gli agenti LLM congelati convertendo i fallimenti di interazione ricorrenti in interventi riutilizzabili. Dimostra un miglioramento medio dell'88,5% su 116 delle 126 configurazioni modello-ambiente su sette ambienti deterministici.