Accademico
Page 1 of 1

Uno studio su quando chiedere chiarimenti per evitare errori a cascata negli agenti AI a lungo termine
Chiedi presto, tardi o giusto: quando conta il tempismo delle richieste di chiarimento?
Studio sul tempismo delle richieste di chiarimento in agenti AI a lungo orizzonte. Un framework di iniezione forzata rivela che il valore dei chiarimenti dipende dal tipo e dal momento: obiettivo utile solo nel primo 10%, input fino al 50%. Nessun modello attuale chiede nel momento ottimale.

Modelli byte-level con diffusione e speculazione per generazione più rapida e riduzione dei costi
Fast Byte Latent Transformer: efficienza e innovazione
Il nuovo Fast Byte Latent Transformer (BLT) introduce BLT Diffusion e Self-speculation per generare byte in parallelo, riducendo fino al 92% la larghezza di banda. Valutato su traduzione e generazione di codice a scale 1B e 3B, mantiene prestazioni competitive con minori risorse computazionali.