Tailored news hub
categoria

Modelli Linguistici

Modelli linguistici di grandi dimensioni — i loro rilasci, architetture, capacità e confronti diretti.

4 articoli
MiniCPM5-1B: Un Modello AI On-Device da 1B Parametri con Ragionamento Duale
Scopri le caratteristiche, le varianti e la rivoluzionaria modalità "Think/No Think" di MiniCPM5-1B per prestazioni AI all'avanguardia su dispositivi con risorse limitate.

MiniCPM5-1B: Un Modello AI On-Device da 1B Parametri con Ragionamento Duale

Esplora MiniCPM5-1B, il modello linguistico causale denso da 1B parametri ottimizzato per l'esecuzione on-device. Approfondisci la sua architettura LlamaForCausalLM, la finestra di contesto di 131.072 token e le varianti disponibili (BF16, SFT, GGUF, MLX). Impara come la modalità di chat "Think/No Think" abilita ragionamento complesso e risposte rapide con un unico checkpoint.

Cosa sono i Modelli Linguistici "Uncensored" e Qwen3.5-35B-A3B-Heretic-V2?
Scopri come i modelli linguistici senza censura offrono libertà creativa e controllo, esplorando l'architettura di Qwen3.5-35B-A3B-Heretic-V2 e le sue innovazioni tecniche.

Cosa sono i Modelli Linguistici "Uncensored" e Qwen3.5-35B-A3B-Heretic-V2?

Approfondisci il mondo dei modelli linguistici non censurati e l'impatto di Qwen3.5-35B-A3B-Heretic-V2. Comprendi i vantaggi per ricercatori e sviluppatori, l'architettura Mixture-of-Experts, la Predizione Multi-Token Nativa e i vari formati di distribuzione.

Grok V9-Medium Completa Addestramento, Rilascio Previsto a Giugno
xAI annuncia la conclusione dell'addestramento del modello fondazionale da 1,5 trilioni di parametri, triplicando le dimensioni del predecessore e migliorando la programmazione.

Grok V9-Medium Completa Addestramento, Rilascio Previsto a Giugno

xAI ha completato l'addestramento di Grok V9-Medium, un modello AI da 1,5 trilioni di parametri, con rilascio pubblico atteso a giugno 2026. Il nuovo sistema migliora significativamente le capacità di programmazione e risolve le criticità del predecessore v8-small, puntando a una maggiore completezza e qualità dei dati.

Inside Talkie: il modello linguistico addestrato solo su testi pre-1931
Come un modello di 13 miliardi di parametri, addestrato esclusivamente su testi antecedenti il 1931, generalizza e risponde a domande moderne.

Inside Talkie: il modello linguistico addestrato solo su testi pre-1931

Scopri Talkie, un modello linguistico da 13B parametri sviluppato da Nick Levine, Alec Radford e David Duvenaud, addestrato solo su 260 miliardi di token di testi pubblicati prima del 1931. Analizziamo le fonti, le capacità, le limitazioni e le reazioni della comunità. Un'esplorazione approfondita di questo esperimento di generalizzazione AI.