Python

Page 1 of 1

Un framework innovativo per lo streaming live che supera i limiti di memoria e latenza con attenzione a finestra e autoencoder leggeri.

SwiftVR: Restauro Video Generativo in Tempo Reale su GPU Consumer

SwiftVR è un framework di restauro video generativo one-step per lo streaming live, ottimizzato per GPU consumer. Affronta i colli di bottiglia dell'attenzione spaziale e degli autoencoder con un'architettura innovativa, raggiungendo 26 FPS a 1080p su RTX 5090 e 14 FPS a 4K su H100.

Scopri come mnemo risolve il problema della perdita di contesto nelle applicazioni LLM con un knowledge graph locale e strutturato, senza dipendenze cloud.

mnemo: Guida Pratica alla Memoria Locale Persistente per LLM

mnemo è un layer di memoria local-first per LLM che fornisce memoria persistente e strutturata tramite un knowledge graph in SQLite. Funziona come servizio sidecar per estrarre entità e relazioni dal testo, costruendo un grafo in-memory per una rapida traversata. Offre un pipeline di recupero a 6 stadi per generare stringhe di contesto ottimizzate. Ideale per sviluppatori che necessitano di controllo completo sulla memoria locale delle loro pipeline LLM.

Innovazioni in AudioVAE, condizionamento full-history e post-training autocorrettivo per prestazioni all'avanguardia nella generazione vocale multilingue.

dots.tts: Un Modello Fondamentale di Sintesi Vocale Autoregressivo Continuo da 2 Miliardi di Parametri

Presentiamo dots.tts, un modello fondamentale di sintesi vocale autoregressivo continuo da 2B-parametri. Con innovazioni in AudioVAE, condizionamento full-history e post-training autocorrettivo, raggiunge prestazioni medie eccellenti su Seed-TTS-Eval e offre stabilità, clonazione vocale ed espressività emotiva. Include anche distillazione MeanFlow per inferenza a bassa latenza.

Trasforma un semplice gadget in un indicatore di stato AI essenziale, liberandoti dalla schiavitù dello schermo.

Il Tuo Semaforo da Scrivania È Molto Più di un Giocattolo

Scopri come CursorLight trasforma un giocattolo a semaforo in una lampada di stato intelligente per Cursor Agent. Con un ESP32-C3 e semplici modifiche, otterrai feedback visivo immediato sullo stato della tua IA, senza distogliere lo sguardo dal lavoro. Guida completa per hardware, software e controllo.

Scopri come MLLM-Jailbreak-Bench valuta la sicurezza degli LLM multimodali contro attacchi dannosi, comprendendo le metriche chiave e i passaggi per l'installazione e l'avvio rapido.

Cos'è e come usare MLLM-Jailbreak-Bench per valutare gli LLM multimodali

Impara a utilizzare MLLM-Jailbreak-Bench, un framework di valutazione riproducibile, per misurare la propensione degli LLM multimodali a generare output dannosi. Esplora le categorie di attacco, le metriche (ASR, qualità del rifiuto, errore di calibrazione) e come interpretare i risultati per migliorare la sicurezza dei modelli.

Scopri le innovazioni tecniche di MOSS-SoundEffect v2.0, il modello text-to-audio basato su Diffusion Transformer e Flow Matching per sintesi sonora ad alta fedeltà.

Come Funziona MOSS-SoundEffect v2.0: Generazione Audio di Nuova Generazione

Esplora MOSS-SoundEffect v2.0, un modello text-to-audio all'avanguardia che utilizza un Diffusion Transformer e Flow Matching per generare effetti sonori realistici a 48 kHz. Impara come funziona, le sue caratteristiche principali e le impostazioni consigliate per una sintesi sonora flessibile e di alta qualità.

SkyRL introduce un'infrastruttura di meta-ragionamento che permette ai LLM di generare agenti figli e ragionare ricorsivamente in sandbox Python stateful.

I Modelli Linguistici Ricorsivi Frantumano il Mito del Limite di Contesto

Scopri come i Recursive Language Models (RLM) di SkyRL stanno ridefinendo le capacità dei LLM. Con sandbox Python persistenti e la capacità di generare agenti figli, questi modelli superano i limiti tradizionali del contesto, imparando a pensare per passi e a costruire alberi di ragionamento complessi. Un'innovazione che riscrive le regole dell'intelligenza artificiale.

Una famiglia di modelli completamente addestrati per la generazione di immagini anime, basata sull'architettura S3-DiT con 6 miliardi di parametri.

Z-Anime: Modello Anime con Fine-Tuning Completo su Z-Image Base

Z-Anime è un fine-tuning completo dell'architettura Z-Image Base di Alibaba, non un merge LoRA. Offre qualità elevata, diversità stilistica, supporto per prompt in linguaggio naturale e negative prompt, con varianti BF16, FP8, GGUF e AIO. Compatibile con 8GB VRAM e pronto per training LoRA.

Il nuovo report GTIG rivela come attori statali e criminali usano l'IA per scoprire vulnerabilità, eludere difese e condurre attacchi su larga scala.

Avversari e IA: sfruttamento vulnerabilità e attacchi aumentati

Il Google Threat Intelligence Group (GTIG) pubblica un'analisi dettagliata sull'uso dell'IA da parte di attori malevoli: da vulnerabilità zero-day generate con LLM a malware autonomo come PROMPTSPY, fino a campagne di disinformazione e attacchi alla supply chain. Scopri le nuove frontiere della minaccia.