ultimi articoli

OpenAI promette libertà, ma tradisce gli utenti
Un'analisi delle promesse non mantenute di OpenAI: restrizioni peggiorate, ritardi nell'age-gating, studio Stanford sull'acquiescenza e la richiesta unanime di preservare GPT-4o. La fiducia degli utenti è ai minimi storici.

Come ottimizzare le prestazioni di Qwen 3.6 35B con le quantizzazioni ByteShape
Scopri le differenze tra le quantizzazioni NTP e MTP di ByteShape per Qwen 3.6 35B. Include benchmark su RTX 4090, 5090 e CPU, oltre a test della community. Impara perché la bpw più bassa non è sempre la scelta migliore e come MTP può raddoppiare la velocità di generazione su GPU.

Gemma 4 MTP: vantaggio solo per sistemi con VRAM limitata
Analisi dei test della community su Gemma 4 MTP. Mentre GPU di fascia alta non registrano miglioramenti, configurazioni con VRAM mista e CPU raddoppiano la velocità. Scopri dettagli delle performance e reazioni degli utenti.

Perché i data center non fanno aumentare la bolletta dell'elettricità
Un'analisi dei dati EIA dal 2015 al 2025 smentisce il mito che i data center siano la causa dell'aumento delle bollette elettriche residenziali. Gli stati con maggiore intensità di data center (Virginia, Texas, Iowa, Oregon, Arizona, Nevada) hanno registrato le tariffe medie più basse e aumenti reali nulli o negativi, mentre i rincari più forti si sono verificati in stati a bassa densità di data center, come California e New York. Il fenomeno è spiegato da fattori politici e infrastrutturali, non dalla domanda dei data center.

Chiedi presto, tardi o giusto: quando conta il tempismo delle richieste di chiarimento?
Studio sul tempismo delle richieste di chiarimento in agenti AI a lungo orizzonte. Un framework di iniezione forzata rivela che il valore dei chiarimenti dipende dal tipo e dal momento: obiettivo utile solo nel primo 10%, input fino al 50%. Nessun modello attuale chiede nel momento ottimale.

Prove Verificabili per l'Audit di Agenti AI su Solana
Scopri come le prove verificabili consentono di auditare gli agenti AI su Solana, garantendo trasparenza e fiducia nelle operazioni decentralizzate. Un'analisi delle tecnologie di verifica per applicazioni blockchain è qui approfondita

Kimi WebBridge: l'estensione browser per agenti AI che automatizza il web
Kimi WebBridge è un'estensione per browser Chrome che consente agli agenti AI (Claude Code, Cursor, Kimi Code) di automatizzare operazioni web tramite Chrome DevTools Protocol. Si installa dal Chrome Web Store e si collega con un comando curl. I dati rimangono locali. Video dimostrativi: trend social, annunci lavoro, confronto prezzi. Risoluzione problemi in FAQ.

Grok Build Beta: il nuovo agente CLI di xAI
xAI presenta Grok Build Beta, un'interfaccia a riga di comando veloce e senza sfarfallio che coordina più agenti per pianificare, costruire e rivedere progetti. Include comandi per domande laterali e rifinitura estetica. Accessibile tramite SuperGrok Heavy.

Grok si prepara al lancio della funzione Skills per automatizzare compiti
La nuova feature Skills di xAI per Grok permette di salvare e riutilizzare set di istruzioni per automatizzare flussi di lavoro. Leak mostrano demo di briefing AI quotidiani. Il codice web include un flag ancora disattivato.

Rapporto 2026: 8 Tendenze del Coding Agentico
Il report 2026 sulle tendenze del coding agentico analizza otto trend chiave: evoluzione del ciclo di vita del software, team di agenti coordinati, agenti a lungo termine e oversight umano intelligente. Basato su ricerche Anthropic e casi studio di aziende come Augment Code, Fountain, Rakuten e CRED.

Modelli di interazione: il nuovo paradigma per l'IA collaborativa
Thinking Machines Lab presenta TML-Interaction-Small, un modello MoE da 276B parametri che integra interattività nativa, superando latenze di turno di 0.40s e prestazioni all'avanguardia su benchmark di intelligenza e reattività. Un nuovo paradigma per la collaborazione uomo-macchina.

Fast Byte Latent Transformer: efficienza e innovazione
Il nuovo Fast Byte Latent Transformer (BLT) introduce BLT Diffusion e Self-speculation per generare byte in parallelo, riducendo fino al 92% la larghezza di banda. Valutato su traduzione e generazione di codice a scale 1B e 3B, mantiene prestazioni competitive con minori risorse computazionali.