ai/news — ultimi articoli 2

ultimi articoli

Scalabilità di PEFT: Verso Milioni di Modelli Personali con Trillioni di Parametri

Il documento "On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters" esamina le tecniche di Parameter-Efficient Fine-Tuning (PEFT) nel contesto della scalabilità. L'obiettivo è abilitare la creazione di milioni di modelli personalizzati basati su architetture con trillioni di parametri, evidenziando le sfide e le opportunità nell'adattamento di modelli linguistici di grandi dimensioni.

LLMs

Come LFM2.5-8B-A1B Rivoluziona gli Assistenti Personali On-Device

LFM2.5-8B-A1B è un nuovo modello ibrido da 8.3B parametri, progettato per il deployment on-device. Offre prestazioni competitive e throughput impareggiabile per assistenti personali, supportando tool calls e istruzioni complesse. Ottimizzato per CPU/GPU con compatibilità nativa per llama.cpp, MLX, vLLM e SGLang.

Assistenti Personali

Claude per Scrittura e Ricerca: L'Arte di Ottenere il Meglio dall'AI

Guida pratica basata su esperienze utente Reddit sull'uso di Claude per scrittura e ricerca non-code. Strategie per editing, gestione del contesto lungo e tecniche di prompting per ottenere risposte critiche e meno generiche. Include configurazioni utente e approfondimenti tecnici.

Sistemi Agentici

Munder Difflin Rivoluziona l'IA Multi-Agente

Esplora Munder Difflin, il sistema multi-agente open source che trae ispirazione dalla serie "The Office" per creare un framework innovativo. Scopri come questa architettura unica sta definendo nuovi standard per lo sviluppo di agenti autonomi e simulazioni complesse.

Sicurezza IA

La memoria di ChatGPT: un aiuto o un ostacolo inatteso?

Il nuovo sistema di memoria di ChatGPT genera riassunti automatici delle conversazioni passate, sollevando preoccupazioni tra gli utenti di r/ChatGPT. Le critiche riguardano l'irrilevanza delle informazioni memorizzate, la gestione macchinosa e l'impatto negativo sui progetti strutturati.

Sistemi Agentici

Come Science Superpowers trasforma gli agenti AI in collaboratori scientifici

Science Superpowers converte un agente AI in un collaboratore scientifico disciplinato, implementando un workflow rigoroso e preregistrato. Questo sistema previene p-hacking e HARKing, garantisce riproducibilità e verifica i risultati. Adattato dalla metodologia Superpowers per lo sviluppo software, si concentra sulla preregistrazione. Funziona senza dipendenze di terze parti e si integra con vari harness AI come Cursor, Claude Code e Gemini CLI.

Addestramento

SANA-Streaming: Editing Video in Tempo Reale con Transformer a Diffusione Ibrido

SANA-Streaming è un framework co-progettato per l'editing video in tempo reale su GPU consumer. Utilizza un transformer a diffusione ibrido e una regolarizzazione ciclo-inversa per garantire consistenza temporale e throughput elevato, raggiungendo 24 FPS a 1280x704 su una singola RTX 5090.

Audio

Come UNISON Unifica Generazione ed Editing Audio con Deep LLM

UNISON è un framework unificato di flow-matching latente per la generazione e l'editing di audio e parlato. Utilizzando un singolo set di pesi, integra text-to-audio, text-to-speech, clonazione vocale zero-shot e editing di scene audio/vocali in un unico modello, architettura e passaggio in avanti.

Assistenti Personali

L'AI non è abbastanza intelligente: la filosofia come chiave per la profondità

Questo articolo esplora come il "priming" dell'intelligenza artificiale con concetti filosofici possa superare i limiti delle sue risposte attuali, rendendole più profonde, eticamente consapevoli e concettualmente ricche. Analizziamo il potenziale dell'umanistica digitale per sbloccare nuove frontiere nell'interazione AI.

Addestramento

Harness-1: Reinforcement Learning per Agenti di Ricerca con Esternazione di Stato

Presentazione di Harness-1, un sistema di Reinforcement Learning che impiega "harness" per permettere agli agenti di ricerca di esternalizzare il proprio stato, ottimizzando le prestazioni e la gestione delle informazioni.

Sistemi Agentici

Come sandboxed abilita piattaforme AI multi-tenant con ambienti di sviluppo isolati

Sandboxed è un engine open-source per builder di app AI, che trasforma un server in una piattaforma multi-tenant. Crea sandbox Linux isolate con agenti di codifica e URL live, gestendo il sonno/risveglio automatico per ottimizzare le risorse. Utilizza Docker, Traefik e SQLite per un controllo semplificato.

Programmazione IA

Come integrare LLM esterni in Claude Code con cc-fleet

cc-fleet consente di utilizzare modelli di linguaggio esterni (DeepSeek, GLM, Qwen, ecc.) come agenti in Claude Code. Questo strumento Go CLI gestisce profili venditore, chiavi API e orchestrazione tmux, risolvendo problemi di sicurezza e credenziali. Installazione e configurazione rapida per estendere le capacità di Claude Code.