LLM
Page 6 of 7

Suite LLM greca di Sophia AI per la sovranità digitale
Sophia AI presenta una suite completa di modelli AI in lingua greca, focalizzata su sovranità tecnologica, linguistica e dei dati. Include modelli di testo, immagini, video, voce e un agente di ricerca. I modelli superano i benchmark aperti greci del 50%, con garanzie di conformità GDPR e AI Act.

Guida pratica a TartarusAI CLI: terminale AI senza censure
TartarusAI CLI è il terminale ufficiale per l'agente AI senza filtri. Supporta sicurezza informatica, penetration testing, deoffuscamento e refactoring di interi repository. Billing solo in criptovaluta, nessuna carta di credito.

Can I Finetune This: Guida pratica al fine-tuning LLM su GPU consumer
Scopri come stimare il consumo di VRAM per il fine-tuning di modelli linguistici di grandi dimensioni su GPU consumer. Include benchmark reali, calibrazione automatica e generazione di script di addestramento pronti all'uso con Hugging Face e PEFT.

Inside Talkie: il modello linguistico addestrato solo su testi pre-1931
Scopri Talkie, un modello linguistico da 13B parametri sviluppato da Nick Levine, Alec Radford e David Duvenaud, addestrato solo su 260 miliardi di token di testi pubblicati prima del 1931. Analizziamo le fonti, le capacità, le limitazioni e le reazioni della comunità. Un'esplorazione approfondita di questo esperimento di generalizzazione AI.

OpenAI promette libertà, ma tradisce gli utenti
Un'analisi delle promesse non mantenute di OpenAI: restrizioni peggiorate, ritardi nell'age-gating, studio Stanford sull'acquiescenza e la richiesta unanime di preservare GPT-4o. La fiducia degli utenti è ai minimi storici.

Come ottimizzare le prestazioni di Qwen 3.6 35B con le quantizzazioni ByteShape
Scopri le differenze tra le quantizzazioni NTP e MTP di ByteShape per Qwen 3.6 35B. Include benchmark su RTX 4090, 5090 e CPU, oltre a test della community. Impara perché la bpw più bassa non è sempre la scelta migliore e come MTP può raddoppiare la velocità di generazione su GPU.

Gemma 4 MTP: vantaggio solo per sistemi con VRAM limitata
Analisi dei test della community su Gemma 4 MTP. Mentre GPU di fascia alta non registrano miglioramenti, configurazioni con VRAM mista e CPU raddoppiano la velocità. Scopri dettagli delle performance e reazioni degli utenti.

Perché i data center non fanno aumentare la bolletta dell'elettricità
Un'analisi dei dati EIA dal 2015 al 2025 smentisce il mito che i data center siano la causa dell'aumento delle bollette elettriche residenziali. Gli stati con maggiore intensità di data center (Virginia, Texas, Iowa, Oregon, Arizona, Nevada) hanno registrato le tariffe medie più basse e aumenti reali nulli o negativi, mentre i rincari più forti si sono verificati in stati a bassa densità di data center, come California e New York. Il fenomeno è spiegato da fattori politici e infrastrutturali, non dalla domanda dei data center.

Chiedi presto, tardi o giusto: quando conta il tempismo delle richieste di chiarimento?
Studio sul tempismo delle richieste di chiarimento in agenti AI a lungo orizzonte. Un framework di iniezione forzata rivela che il valore dei chiarimenti dipende dal tipo e dal momento: obiettivo utile solo nel primo 10%, input fino al 50%. Nessun modello attuale chiede nel momento ottimale.

Prove Verificabili per l'Audit di Agenti AI su Solana
Scopri come le prove verificabili consentono di auditare gli agenti AI su Solana, garantendo trasparenza e fiducia nelle operazioni decentralizzate. Un'analisi delle tecnologie di verifica per applicazioni blockchain è qui approfondita

Grok Build Beta: il nuovo agente CLI di xAI
xAI presenta Grok Build Beta, un'interfaccia a riga di comando veloce e senza sfarfallio che coordina più agenti per pianificare, costruire e rivedere progetti. Include comandi per domande laterali e rifinitura estetica. Accessibile tramite SuperGrok Heavy.

Grok si prepara al lancio della funzione Skills per automatizzare compiti
La nuova feature Skills di xAI per Grok permette di salvare e riutilizzare set di istruzioni per automatizzare flussi di lavoro. Leak mostrano demo di briefing AI quotidiani. Il codice web include un flag ancora disattivato.