Sicurezza IA

Un'analisi delle reazioni della comunità r/ChatGPT alla nuova funzionalità di memorizzazione automatica delle conversazioni e i suoi effetti sui progetti degli utenti.

La memoria di ChatGPT: un aiuto o un ostacolo inatteso?

Il nuovo sistema di memoria di ChatGPT genera riassunti automatici delle conversazioni passate, sollevando preoccupazioni tra gli utenti di r/ChatGPT. Le critiche riguardano l'irrilevanza delle informazioni memorizzate, la gestione macchinosa e l'impatto negativo sui progetti strutturati.

Un gruppo ha de-censurato 168 modelli con uno script da $20, esponendo la fragilità dei guardrail di sicurezza basati su RLHF e DPO.

L'Allineamento degli LLM Costa Milioni, Svanisce per Venti Dollari

Meta ha emesso un ordine di cessazione e desistenza contro Heretic, un gruppo che ha rimosso gli strati di sicurezza dagli LLM a pesi aperti spendendo solo 20 dollari in elettricità. Questo articolo esplora come la "chirurgia dei pesi" automatizzata di Heretic mini l'economia dell'allineamento, trasformando milioni di dollari di investimenti in una spesa irrisoria per l'attaccante.

Scopri come MLLM-Jailbreak-Bench valuta la sicurezza degli LLM multimodali contro attacchi dannosi, comprendendo le metriche chiave e i passaggi per l'installazione e l'avvio rapido.

Cos'è e come usare MLLM-Jailbreak-Bench per valutare gli LLM multimodali

Impara a utilizzare MLLM-Jailbreak-Bench, un framework di valutazione riproducibile, per misurare la propensione degli LLM multimodali a generare output dannosi. Esplora le categorie di attacco, le metriche (ASR, qualità del rifiuto, errore di calibrazione) e come interpretare i risultati per migliorare la sicurezza dei modelli.

Il dietrofront di Sam Altman su ChatGPT 4o rivela un sistema di sicurezza invasivo, un declino delle prestazioni e una profonda crisi di fiducia tra gli utenti paganti.

OpenAI: Una Promessa Svuotata e i Costi Nascosti dell'AI Castrata

L'annuncio di Sam Altman di allentare le restrizioni di ChatGPT 4o è accolto con scetticismo e rabbia dagli utenti. L'articolo esplora come le nuove politiche di sicurezza abbiano degradato le prestazioni, causato danni psicologici e manipolato gli utenti, trasformando un potente strumento in un'ombra di sé stesso.

Nonostante gli annunci di rilassamento, i controlli si sono intensificati, danneggiando utenti vulnerabili e creativi

OpenAI promette libertà, ma tradisce gli utenti

Un'analisi delle promesse non mantenute di OpenAI: restrizioni peggiorate, ritardi nell'age-gating, studio Stanford sull'acquiescenza e la richiesta unanime di preservare GPT-4o. La fiducia degli utenti è ai minimi storici.

I dati EIA mostrano che gli stati con più data center hanno le tariffe più basse e gli aumenti reali più contenuti

Perché i data center non fanno aumentare la bolletta dell'elettricità

Un'analisi dei dati EIA dal 2015 al 2025 smentisce il mito che i data center siano la causa dell'aumento delle bollette elettriche residenziali. Gli stati con maggiore intensità di data center (Virginia, Texas, Iowa, Oregon, Arizona, Nevada) hanno registrato le tariffe medie più basse e aumenti reali nulli o negativi, mentre i rincari più forti si sono verificati in stati a bassa densità di data center, come California e New York. Il fenomeno è spiegato da fattori politici e infrastrutturali, non dalla domanda dei data center.