Modelli Linguistici
Modelli linguistici di grandi dimensioni — i loro rilasci, architetture, capacità e confronti diretti.

MiniCPM5-1B: Un Modello AI On-Device da 1B Parametri con Ragionamento Duale
Esplora MiniCPM5-1B, il modello linguistico causale denso da 1B parametri ottimizzato per l'esecuzione on-device. Approfondisci la sua architettura LlamaForCausalLM, la finestra di contesto di 131.072 token e le varianti disponibili (BF16, SFT, GGUF, MLX). Impara come la modalità di chat "Think/No Think" abilita ragionamento complesso e risposte rapide con un unico checkpoint.

Cosa sono i Modelli Linguistici "Uncensored" e Qwen3.5-35B-A3B-Heretic-V2?
Approfondisci il mondo dei modelli linguistici non censurati e l'impatto di Qwen3.5-35B-A3B-Heretic-V2. Comprendi i vantaggi per ricercatori e sviluppatori, l'architettura Mixture-of-Experts, la Predizione Multi-Token Nativa e i vari formati di distribuzione.

Grok V9-Medium Completa Addestramento, Rilascio Previsto a Giugno
xAI ha completato l'addestramento di Grok V9-Medium, un modello AI da 1,5 trilioni di parametri, con rilascio pubblico atteso a giugno 2026. Il nuovo sistema migliora significativamente le capacità di programmazione e risolve le criticità del predecessore v8-small, puntando a una maggiore completezza e qualità dei dati.

Inside Talkie: il modello linguistico addestrato solo su testi pre-1931
Scopri Talkie, un modello linguistico da 13B parametri sviluppato da Nick Levine, Alec Radford e David Duvenaud, addestrato solo su 260 miliardi di token di testi pubblicati prima del 1931. Analizziamo le fonti, le capacità, le limitazioni e le reazioni della comunità. Un'esplorazione approfondita di questo esperimento di generalizzazione AI.