home›LLMs›

Inside Talkie: il modello linguistico addestrato solo su testi pre-1931

Come un modello di 13 miliardi di parametri, addestrato esclusivamente su testi antecedenti il 1931, generalizza e risponde a domande moderne.

21 maggio 2026

#Addestramento #Agenti #Generazione Contenuti #LLM #Open Source

Scopri Talkie, un modello linguistico da 13B parametri sviluppato da Nick Levine, Alec Radford e David Duvenaud, addestrato solo su 260 miliardi di token di testi pubblicati prima del 1931. Analizziamo le fonti, le capacità, le limitazioni e le reazioni della comunità. Un'esplorazione approfondita di questo esperimento di generalizzazione AI.

Un Modello Linguistico Intrappolato nel Tempo

Il 27 aprile 2026, un piccolo team di ricercatori ha rilasciato un modello linguistico diverso da qualsiasi altro.

Chiamato Talkie, il trasformatore da 13 miliardi di parametri è stato addestrato esclusivamente su testi pubblicati prima del 1931.

L'annuncio, pubblicato su X (ex Twitter) alle 23:34 dal co-autore Nick Levine (@status_effects), ha subito attirato l'attenzione.

Entro 24 ore, il tweet aveva accumulato oltre 1,1 milioni di visualizzazioni, insieme a 3.000 like, 543 risposte e 1.600 segnalibri.

Il modello è stato sviluppato da Nick Levine, Alec Radford (@AlecRad) e David Duvenaud (@DavidDuvenaud).

Il loro obiettivo dichiarato non era costruire un assistente pratico, ma rispondere a una domanda di ricerca fondamentale: come fanno i modelli linguistici a generalizzare oltre la loro distribuzione di addestramento?

Se un modello non ha mai visto una riga di codice, può imparare a scrivere Python? Se conosce il mondo solo come veniva descritto nel 1930, può ragionare sul presente?

Talkie è stato costruito per scoprirlo.

L'Archivio: Costruire un Corpus Pre-1931

Addestrare un modello da 13 miliardi di parametri richiede enormi quantità di testo.

Per Talkie, il team ha assemblato circa 260 miliardi di token di materiale antecedente al 1931.

Questa cifra è stata avanzata dall'utente will depue (@willdepue) nel thread dell'annuncio e non è stata contestata dagli autori.

Le fonti primarie di dati sono state la Institutional Data Initiative e l'Internet Archive, integrate da un "mucchio di altre fonti".

Fondamentalmente, il corpus non era un campione casuale di testo storico.

Includeva decine di libri di consultazione storici con formati regolari e strutturati:

Enciclopedie che catturavano la conoscenza di inizio Novecento
Manuali di galateo che codificavano le norme sociali dell'epoca
Manuali di scrittura epistolare che preservavano stili comunicativi formali
Libri di cucina che documentavano la vita domestica e gli ingredienti disponibili

Per estrarre e strutturare questi dati, il team ha scritto parser personalizzati usando Claude Code.

Questi parser hanno trasformato pagine scansionate e digitalizzate in testo pulito e leggibile dalla macchina, adatto all'addestramento di modelli linguistici.

Gli autori si sono impegnati a pubblicare ulteriori dettagli sul corpus in futuro.

Dove possibile, intendono rilasciare i dati stessi, o almeno gli script necessari per ricostruire il dataset da fonti pubbliche.

A surreal, dimly lit library where towering shelves of antique books dissolve into pixelated data streams, their pages fluttering like autumn leaves. In the center, a translucent human silhouette composed of overlapping text fragments—encyclopedias, etiquette manuals, cookbooks—holds a quill that drips ink into a glowing, modern computer terminal. The ink swirls into a mirror reflecting a foggy, anachronistic cityscape: horse-drawn carriages next to neon signs, gambling dens overgrown with vines. Soft sepia tones clash with cold blue digital light, evoking a statistical pastiche—a window that is also a mirror, blending eras without resolution.

Capacità, Limiti e Comportamento Anacronistico

Le risposte di Talkie sono interamente plasmate dall'ambito temporale dei suoi dati di addestramento.

I primi utenti hanno rapidamente individuato comportamenti affascinanti e inquietanti.

Un utente ha riferito che Talkie "afferma che il gioco d'azzardo non esisterà entro il 2020".

Questo è un classico esempio di inferenza anacronistica: il modello ha estrapolato tendenze pre-1931 — forse un periodo di sentimenti anti-gioco d'azzardo o di proibizione legale — e ha proiettato quella traiettoria in avanti, ignorando la massiccia espansione del gioco d'azzardo legale tra la fine del XX e l'inizio del XXI secolo.

Altri utenti hanno notato limiti più fondamentali.

Yasi Khan (@yasmeena_khan) ha osservato che Talkie "sembra pensare di coprire solo il 1700-1799", suggerendo che al modello manchino i metadati o l'autoconsapevolezza per descrivere accuratamente il proprio periodo di addestramento.

Gli autori non hanno risposto a questa osservazione nel thread.

Christiano Boria (@christianoboria) ha offerto una critica più severa: "le risposte non sembrano quelle di qualcuno del periodo pre-1931".

Ciò solleva un punto sottile ma importante. Un modello addestrato su testi di un'epoca non replica necessariamente lo stile cognitivo, le credenze o le norme conversazionali di una persona vissuta in quell'epoca.

Potrebbe produrre una sorta di pasticcio statistico — una mescolanza di voci e prospettive che non è mai esistita in una singola mente umana.

Andrew Gordon Wilson (@andrewgwils) ha esteso questa critica all'intera impresa dell'interazione con i LLM:

"Non sento che parlare con un LLM addestrato su dati contemporanei sia come parlare con una persona moderna."

Se un modello addestrato su dati contemporanei non replica un essere umano contemporaneo, cosa significa parlare con un modello addestrato su dati storici?

È una finestra sul passato, o solo uno specchio che riflette gli schemi statistici del testo archiviato?

Reazioni della Comunità e Applicazioni Pratiche

Nonostante le domande filosofiche, la risposta della comunità è stata estremamente positiva.

Gli utenti hanno descritto il progetto come "figo", "fantastico", "davvero buono", "sano" e "la cosa più bella che ho visto questo mese".

Il checkpoint è stato reso disponibile per il download e molti utenti hanno espresso interesse a eseguirlo localmente.

Phil Trubey ha indicato la sua intenzione di scaricare ed eseguire il modello. Altri utenti hanno chiesto accesso al terminale per sperimentarlo direttamente.

Le applicazioni pratiche immaginate dagli utenti erano creative e varie.

Un utente voleva chiedere a Talkie: "Come va tutta la faccenda del voto alle donne?" — una domanda che avrebbe ricevuto risposte molto diverse a seconda che il modello fosse a conoscenza del Diciannovesimo Emendamento (ratificato nel 1920) o meno.

Ben Nash (@bennash) ha taggato l'autore Orson Scott Card, notando che il progetto "sembra un passo avanti verso Pastwatch" — un riferimento al romanzo di fantascienza di Card Pastwatch: The Redemption of Christopher Columbus, in cui i ricercatori usano un dispositivo per vedere e potenzialmente alterare il passato.

Il thread ha inoltre fatto riferimento a un post speculativo precedente del 30 settembre 2025, dell'utente Deep Thrill (@DeeperThrill).

Quel post si chiedeva se addestrare un'IA su tutta la conoscenza fino al 1899 e testare se potesse fare salti creativi in fisica — in particolare riguardo all'etere e al perielio di Mercurio.

Talkie, addestrato su dati che si estendono per 32 anni in più, rappresenta una realizzazione parziale di quell'esperimento mentale.

Domande Aperte e Direzioni Future

Il progetto Talkie lascia diverse domande importanti senza risposta.

Jiaxin Wen (@jiaxinwen22) ha posto una domanda tecnica critica: i dati di istruzione utilizzati per il fine-tuning sono stati generati sottoponendo LLM a testi storici?

In tal caso, il comportamento del modello potrebbe riflettere non solo il corpus storico, ma anche i pregiudizi e l'inquadramento del moderno LLM utilizzato per generare gli esempi di istruzione.

Gli autori non hanno risposto a questa domanda nel thread.

Altre domande aperte includono:

Generalizzazione alla programmazione: Un modello addestrato solo su testi pre-1931 può imparare a scrivere codice moderno? Gli autori hanno menzionato esplicitamente questa come motivazione, ma non sono stati condivisi risultati.
Consapevolezza temporale di sé: Perché il modello sembra confuso riguardo al proprio periodo di addestramento? Si può risolvere con migliori prompt o metadati?
Autenticità vs. pastiche: Esiste un modo per valutare se il modello riflette genuinamente prospettive storiche, o solo schemi statistici?
Pubblicazione dei dati: Gli autori hanno invitato la comunità a fornire feedback su quali aspetti — in particolare il codice — sarebbe più interessante rilasciare.

Il team prevede di pubblicare maggiori informazioni sul corpus e di rilasciare quanti più dati possibile, inclusi gli script di ricostruzione.

Per ora, Talkie si presenta come un audace esperimento di modellazione linguistica temporalmente vincolata.

Offre uno sguardo su ciò che accade quando chiediamo a una rete neurale di parlare da un passato che non ha mai vissuto, usando parole che ha solo letto.