2035, l'anno in cui non ci importerà più degli LLM
C'è chi annuncia la morte dell'intelligenza artificiale per "model collapse". Ma forse sta guardando nella direzione sbagliata.
Si parla sempre più spesso di model collapse. È il fenomeno per cui i modelli di linguaggio, se addestrati su testi generati da altri modelli invece che da umani, degradano progressivamente.
Come una fotocopia di una fotocopia, a ogni passaggio si perde qualcosa. E poiché il web si sta riempiendo di contenuti sintetici, il rischio è concreto: tra il 2035 e il 2040, secondo alcune stime, potremmo osservare un deterioramento significativo nella qualità degli LLM. Testi meno affidabili, più ripetitivi, più allucinazioni.
A scriverne è stata Financialounge ed è una preoccupazione legittima. Ma c’è un paradosso in questo dibattito: mentre ci preoccupiamo che gli LLM stiano finendo i dati testuali di qualità su cui addestrarsi, un’altra forma di intelligenza artificiale ha a disposizione una fonte potenzialmente infinita. I video. Le immagini. Il mondo fisico stesso.
È una migrazione dalla cultura del libro alla cultura dell’osservazione. E sta già accadendo.
L’intelligenza artificiale che capisce il mondo
Lo scorso novembre, Yann LeCun ha lasciato Meta. Non è un nome qualunque: è uno dei tre “padri fondatori” del deep learning, premio Turing nel 2018, nonché Chief AI Scientist dell’azienda di Zuckerberg per dodici anni. Ha lasciato per fondare AMI Labs, una startup che punta a una valutazione di 5 miliardi di dollari prima ancora di aver rilasciato un prodotto.
LeCun non ha usato mezzi termini per spiegare la sua scelta. Gli LLM, ha detto, sono “un vicolo cieco per la superintelligenza”. Ha aggiunto che “nessuna persona sana di mente li userà più come componente centrale di un sistema IA” entro cinque anni. Parole forti, se pronunciate da uno che ha contribuito a costruirli.
La sua scommessa si chiama world model. L’idea, semplificando molto, è questa: invece di addestrare un’intelligenza artificiale a predire la parola successiva in una frase, è meglio addestrarla a costruire una rappresentazione interna di come funziona il mondo.
Un bambino di quattro anni capisce la gravità, l’inerzia degli oggetti, il fatto che se lo lascia cadere, un bicchiere si rompe. Non perché qualcuno gliel’ha spiegato a parole ma perché ha osservato il mondo. Un gatto sa pianificare come saltare su un mobile semplicemente guardandolo. Gli LLM, per quanto impressionanti, non sanno fare nulla di tutto questo.
Non solo teoria
La cosa interessante è che i world model non sono solo un’idea accademica. Google DeepMind ha rilasciato ad agosto 2025 Genie 3, definito “il primo world model general-purpose interattivo in tempo reale”: genera mondi 3D navigabili a 24 frame al secondo partendo da semplici descrizioni testuali. DeepMind lo descrive esplicitamente come “un passo cruciale verso l’AGI”.

Meta stessa, nonostante l’uscita di LeCun, ha rilasciato V-JEPA 2, un modello che permette all’AI di anticipare le conseguenze delle proprie azioni nel mondo fisico.
NVIDIA invece al CES 2026 ha presentato Alpamayo, una famiglia di modelli per la guida autonoma che ragionano sugli scenari invece di limitarsi a reagire (lo hanno definito “il momento ChatGPT per la Physical AI”).
OpenAI con Sora 2 sta esplorando modelli video che capiscono la fisica: un tiro mancato a basket rimbalza sul tabellone invece di teletrasportarsi nel canestro.
Fei-Fei Li, altra pioniera dell’AI, con la sua startup World Labs ha già rilasciato Marble, il primo world model commerciale. Genera ambienti 3D persistenti da semplici prompt. Siamo oltre la fase dei paper accademici.
La corsa all’AGI cambia direzione
Perché tutto questo fermento? Perché i world model promettono qualcosa che gli LLM non possono offrire: la capacità di ragionare, pianificare, capire le conseguenze delle azioni.
Sono queste le caratteristiche che separano un sistema che “sembra” intelligente da uno che potrebbe esserlo davvero. La strada verso l’intelligenza artificiale generale, quella che eguaglia o supera le capacità umane, passerà sempre meno dalla predizione del testo e sempre più dalla comprensione del mondo.
Questo non significa che gli LLM spariranno. Lo stesso LeCun parla di un “futuro ibrido”: i world model per i compiti che richiedono comprensione fisica, pianificazione, interazione con la realtà; gli LLM per quello che sanno fare bene, ovvero manipolare il linguaggio. Traduzione, sintesi, generazione di testi continueranno probabilmente a essere territorio degli LLM o dei loro successori.
Il 2035 visto da un’altra angolazione
Torniamo allora alla profezia del model collapse. È un problema reale? Probabilmente sì. Ma è il problema che definirà l’IA del 2035? Questo è molto meno certo.
Se la ricerca continua nella direzione attuale, tra dieci anni gli LLM potrebbero essere quello che le calcolatrici sono per i matematici: strumenti utili, ma non il cuore dell’intelligenza.
Il vero terreno di competizione sarà altrove: nella robotica, nella guida autonoma, negli agenti che operano nel mondo fisico. E lì i world model, non gli LLM, saranno protagonisti.
Certo, resta una domanda aperta: i world model potranno un giorno fare anche quello che oggi fanno gli LLM? Potranno scrivere testi, analizzare documenti, rispondere a domande?
LeCun sembra pensare di sì, nel lungo periodo, altri invece sono più cauti. E naturalmente potrebbe arrivare qualcosa di completamente diverso, un nuovo paradigma che oggi non riusciamo nemmeno a immaginare.
Ma forse la questione è un’altra. Il vero salto di specie non sarà quando l’intelligenza artificiale parlerà come noi: questo, in fondo, lo fa già. Sarà invece quando si muoverà nel mondo con la nostra stessa naturalezza, rendendo la distinzione tra digitale e fisico definitivamente obsoleta.
E a quel punto, il model collapse degli LLM sembrerà un problema di un’altra epoca.
Stefano Silvestri






