LLM

Page 6 of 7

Modelli linguistici, generazione di immagini e video, e agenti di ricerca per il mercato ellenico

Suite LLM greca di Sophia AI per la sovranità digitale

Sophia AI presenta una suite completa di modelli AI in lingua greca, focalizzata su sovranità tecnologica, linguistica e dei dati. Include modelli di testo, immagini, video, voce e un agente di ricerca. I modelli superano i benchmark aperti greci del 50%, con garanzie di conformità GDPR e AI Act.

Come installare e utilizzare il client ufficiale per coding agent uncensored con contesto 256K token

Guida pratica a TartarusAI CLI: terminale AI senza censure

TartarusAI CLI è il terminale ufficiale per l'agente AI senza filtri. Supporta sicurezza informatica, penetration testing, deoffuscamento e refactoring di interi repository. Billing solo in criptovaluta, nessuna carta di credito.

Strumento open-source per stimare VRAM, verificare la fattibilità e generare ricette di addestramento con LoRA e QLoRA

Can I Finetune This: Guida pratica al fine-tuning LLM su GPU consumer

Scopri come stimare il consumo di VRAM per il fine-tuning di modelli linguistici di grandi dimensioni su GPU consumer. Include benchmark reali, calibrazione automatica e generazione di script di addestramento pronti all'uso con Hugging Face e PEFT.

Come un modello di 13 miliardi di parametri, addestrato esclusivamente su testi antecedenti il 1931, generalizza e risponde a domande moderne.

Inside Talkie: il modello linguistico addestrato solo su testi pre-1931

Scopri Talkie, un modello linguistico da 13B parametri sviluppato da Nick Levine, Alec Radford e David Duvenaud, addestrato solo su 260 miliardi di token di testi pubblicati prima del 1931. Analizziamo le fonti, le capacità, le limitazioni e le reazioni della comunità. Un'esplorazione approfondita di questo esperimento di generalizzazione AI.

Nonostante gli annunci di rilassamento, i controlli si sono intensificati, danneggiando utenti vulnerabili e creativi

OpenAI promette libertà, ma tradisce gli utenti

Un'analisi delle promesse non mantenute di OpenAI: restrizioni peggiorate, ritardi nell'age-gating, studio Stanford sull'acquiescenza e la richiesta unanime di preservare GPT-4o. La fiducia degli utenti è ai minimi storici.

Analisi dettagliata delle famiglie NTP e MTP, benchmark su GPU e CPU, e consigli pratici per scegliere il modello più adatto

Come ottimizzare le prestazioni di Qwen 3.6 35B con le quantizzazioni ByteShape

Scopri le differenze tra le quantizzazioni NTP e MTP di ByteShape per Qwen 3.6 35B. Include benchmark su RTX 4090, 5090 e CPU, oltre a test della community. Impara perché la bpw più bassa non è sempre la scelta migliore e come MTP può raddoppiare la velocità di generazione su GPU.

I test della community mostrano che la Multi-Token Prediction di Google è utile solo quando il modello è parzialmente scaricato sulla CPU.

Gemma 4 MTP: vantaggio solo per sistemi con VRAM limitata

Analisi dei test della community su Gemma 4 MTP. Mentre GPU di fascia alta non registrano miglioramenti, configurazioni con VRAM mista e CPU raddoppiano la velocità. Scopri dettagli delle performance e reazioni degli utenti.

I dati EIA mostrano che gli stati con più data center hanno le tariffe più basse e gli aumenti reali più contenuti

Perché i data center non fanno aumentare la bolletta dell'elettricità

Un'analisi dei dati EIA dal 2015 al 2025 smentisce il mito che i data center siano la causa dell'aumento delle bollette elettriche residenziali. Gli stati con maggiore intensità di data center (Virginia, Texas, Iowa, Oregon, Arizona, Nevada) hanno registrato le tariffe medie più basse e aumenti reali nulli o negativi, mentre i rincari più forti si sono verificati in stati a bassa densità di data center, come California e New York. Il fenomeno è spiegato da fattori politici e infrastrutturali, non dalla domanda dei data center.

Uno studio su quando chiedere chiarimenti per evitare errori a cascata negli agenti AI a lungo termine

Chiedi presto, tardi o giusto: quando conta il tempismo delle richieste di chiarimento?

Studio sul tempismo delle richieste di chiarimento in agenti AI a lungo orizzonte. Un framework di iniezione forzata rivela che il valore dei chiarimenti dipende dal tipo e dal momento: obiettivo utile solo nel primo 10%, input fino al 50%. Nessun modello attuale chiede nel momento ottimale.

Come le prove crittografiche trasparenti garantiscono l'affidabilità degli agenti AI sulla blockchain Solana

Prove Verificabili per l'Audit di Agenti AI su Solana

Scopri come le prove verificabili consentono di auditare gli agenti AI su Solana, garantendo trasparenza e fiducia nelle operazioni decentralizzate. Un'analisi delle tecnologie di verifica per applicazioni blockchain è qui approfondita

Disponibile per abbonati SuperGrok Heavy, offre pianificazione, agenti paralleli e rifinitura UI.

Grok Build Beta: il nuovo agente CLI di xAI

xAI presenta Grok Build Beta, un'interfaccia a riga di comando veloce e senza sfarfallio che coordina più agenti per pianificare, costruire e rivedere progetti. Include comandi per domande laterali e rifinitura estetica. Accessibile tramite SuperGrok Heavy.

Leak e mockup rivelano moduli di istruzioni riutilizzabili, con import di file .zip, .skill e .md

Grok si prepara al lancio della funzione Skills per automatizzare compiti

La nuova feature Skills di xAI per Grok permette di salvare e riutilizzare set di istruzioni per automatizzare flussi di lavoro. Leak mostrano demo di briefing AI quotidiani. Il codice web include un flag ancora disattivato.