LLM
Page 1 of 7

SwiftVR: Restauro Video Generativo in Tempo Reale su GPU Consumer
SwiftVR è un framework di restauro video generativo one-step per lo streaming live, ottimizzato per GPU consumer. Affronta i colli di bottiglia dell'attenzione spaziale e degli autoencoder con un'architettura innovativa, raggiungendo 26 FPS a 1080p su RTX 5090 e 14 FPS a 4K su H100.

mnemo: Guida Pratica alla Memoria Locale Persistente per LLM
mnemo è un layer di memoria local-first per LLM che fornisce memoria persistente e strutturata tramite un knowledge graph in SQLite. Funziona come servizio sidecar per estrarre entità e relazioni dal testo, costruendo un grafo in-memory per una rapida traversata. Offre un pipeline di recupero a 6 stadi per generare stringhe di contesto ottimizzate. Ideale per sviluppatori che necessitano di controllo completo sulla memoria locale delle loro pipeline LLM.

dots.tts: Un Modello Fondamentale di Sintesi Vocale Autoregressivo Continuo da 2 Miliardi di Parametri
Presentiamo dots.tts, un modello fondamentale di sintesi vocale autoregressivo continuo da 2B-parametri. Con innovazioni in AudioVAE, condizionamento full-history e post-training autocorrettivo, raggiunge prestazioni medie eccellenti su Seed-TTS-Eval e offre stabilità, clonazione vocale ed espressività emotiva. Include anche distillazione MeanFlow per inferenza a bassa latenza.

q0: Primitivi per il Pre-Addestramento Iper-Epoca nei Modelli Linguistici
Introduzione a q0, un nuovo metodo di pre-addestramento iper-epoca che sfrutta popolazioni di modelli per ottenere una minore perdita di validazione con meno epoche. Migliora l'efficienza dei dati fino a 12.9x e offre ricette per l'allocazione del budget computazionale.

SkillOpt: Ottimizzazione Testuale per Skill di Agenti IA
SkillOpt di Microsoft Research è un ottimizzatore testuale che addestra descrizioni di skill in linguaggio naturale per agenti IA. Trattando la documentazione come stato esterno addestrabile, consente l'auto-evoluzione delle skill. Dimostrato da `@omarsar0` con un miglioramento del 20% nell'estrazione di figure da documenti.

Workflow Dinamici di Anthropic: Orchestrazione Autonoma con Claude Code
I workflow dinamici di Anthropic permettono a Claude di determinare autonomamente la sequenza di azioni a runtime, contrastando i workflow statici. Con Claude Code, sono script JavaScript che orchestrano subagenti per compiti complessi, offrendo scalabilità e ispezionabilità.

Generazione Immagini AI con Solo Emoji su r/ChatGPT
Un utente di r/ChatGPT ha condiviso esperimenti di generazione di immagini AI utilizzando solo prompt composti da emoji, ottenendo risultati inaspettati. Il post ha generato interesse nella comunità, con istruzioni aggiuntive da AutoModerator.

Come usare PentesterFlow per il Pentesting e il Bug Hunting
Scopri PentesterFlow, l'assistente terminale open-source per penetration testing e bug hunting. Integra LLM con strumenti di sicurezza reali per automatizzare, verificare e riportare vulnerabilità, mantenendo il controllo umano. Risolve problemi come allucinazioni AI e integrazione di strumenti, offrendo flussi di lavoro specifici per il dominio.

SCOPE: Self-Play per Task aperti con Co-Evoluzione di Policy
SCOPE è un framework di self-play data-free che allena modelli linguistici per task aperti co-evolvendo un Challenger e un Solver. Utilizza un self-judge basato sul modello iniziale per valutare le risposte. Migliora le prestazioni fino a +10.4 punti su otto benchmark open-ended e +13.8 punti su QA a formato breve.

Il MOBA di Claude 4.8: Sviluppato in un Weekend con IA Generativa
Un MOBA web multiplayer, lmaomoba.com, è stato interamente sviluppato in un weekend usando Claude 4.8 (Opus). Il progetto, che ha sfruttato TypeScript, React e Canvas senza un game engine esterno, ha visto l'IA generare codice, grafica e persino effetti sonori, con un costo stimato di 6.600 $ in token.

Come ProwlFi garantisce la confidenzialità delle transazioni per gli agenti AI su Solana
ProwlFi fornisce infrastrutture per agenti AI basati su Solana, garantendo confidenzialità nelle transazioni senza sacrificare l'auditabilità. Combina indirizzi stealth monouso con pagamenti HTTP x402, permettendo ad ogni pagamento di atterrare su un indirizzo fresco e non collegabile, mantenendo una chiave di visualizzazione per un audit trail privato e completo.

Scalabilità di PEFT: Verso Milioni di Modelli Personali con Trillioni di Parametri
Il documento "On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters" esamina le tecniche di Parameter-Efficient Fine-Tuning (PEFT) nel contesto della scalabilità. L'obiettivo è abilitare la creazione di milioni di modelli personalizzati basati su architetture con trillioni di parametri, evidenziando le sfide e le opportunità nell'adattamento di modelli linguistici di grandi dimensioni.