Cos'è l'AI,
in tre minuti.
Prima di tutto: non è magia, non è fantascienza, non è un cervello elettronico. È uno strumento statistico molto sofisticato.
L'Intelligenza Artificiale è un campo dell'informatica che studia come far sì che i computer eseguano compiti che, se fatti da un essere umano, richiederebbero quello che chiamiamo "intelligenza": riconoscere immagini, capire il linguaggio, prendere decisioni, tradurre testi.
Il termine è volutamente vago — e questo crea molta confusione. Quando diciamo "AI" oggi, nella vita quotidiana, intendiamo quasi sempre una tecnologia specifica chiamata machine learning, e più precisamente una sua variante: il deep learning. Non stiamo parlando di un computer che "pensa" nel senso che intendiamo noi.
Una distinzione che vale la pena fissare subito: l'AI "stretta" (o narrow AI) è quello che usiamo oggi — sistemi che eccellono in un compito preciso. Riconoscere volti, giocare a scacchi, rispondere a domande. L'AI "generale" (AGI), quella dei film, che ragiona su qualsiasi problema come un essere umano, non esiste ancora. Quello che vediamo con ChatGPT o Gemini è AI stretta, molto potente, ma stretta.
L'AI non "sa" nulla nel senso in cui lo sa un essere umano. Ha trovato pattern statistici in miliardi di testi. La differenza sembra sottile, ma cambia tutto nel modo in cui la usiamo e nei suoi limiti.
AI stretta
Eccelle in un dominio specifico. ChatGPT è bravissimo a generare testo, ma non sa guidare un'auto. Un'AI per la guida autonoma non sa scrivere poesie.
AI Generale
Un sistema ipotetico che ragiona su qualsiasi problema come un essere umano. Non esiste. I modelli attuali ne simulano alcuni aspetti, ma rimangono fondamentalmente diversi.
Pattern statistici
Tutta l'AI moderna è, alla radice, statistica applicata a grandi quantità di dati. L'eleganza del risultato nasconde la semplicità (relativa) del meccanismo.
Machine Learning
e Deep Learning.
Due livelli dello stesso concetto. La differenza sta in come il sistema impara dai dati.
Il Machine Learning (apprendimento automatico) è l'idea che un computer possa migliorare le proprie performance su un compito senza essere programmato esplicitamente per ogni caso. Invece di scrivere regole, si mostrano esempi: migliaia di email spam e non-spam, e il sistema impara da solo a distinguerle.
Il Deep Learning è una sottocategoria del ML che usa reti neurali artificiali con molti "strati" di elaborazione. Il nome "neurale" è una metafora: si ispirano vagamente al funzionamento dei neuroni, ma sono molto più semplici. Quello che conta è che ogni strato estrae caratteristiche sempre più astratte dai dati. Il primo strato riconosce linee, il secondo forme, il terzo occhi, il quarto visi — e così via, senza che nessun programmatore abbia mai scritto "cerca un occhio".
È questa capacità di trovare caratteristiche astratte autonomamente che ha reso il deep learning rivoluzionario. E che lo rende anche opaco: spesso non sappiamo esattamente perché un modello prende una certa decisione. Lo chiamiamo il problema della "scatola nera".
Il bambino che impara a camminare
Non lo programmiamo con le regole della deambulazione. Gli diamo esempi (vede gli adulti), feedback (cade, si rialza), e impara. Il ML funziona in modo anaogo: esempi + feedback + aggiustamenti ripetuti.
La scatola nera
Un modello di deep learning può raggiungere il 99% di accuratezza su un compito e noi non riusciamo ancora a spiegare esattamente perché. Questo è un problema serio per l'uso in contesti ad alto rischio (medicina, giustizia).
AI Generativa:
come funziona davvero.
Non recupera informazioni da un database. Le costruisce, parola per parola, ogni volta.
L'AI "classica" era prevalentemente discriminativa: dati in entrata → classificazione in uscita (questa foto è un gatto o un cane?). L'AI generativa fa qualcosa di diverso: produce nuovi contenuti — testi, immagini, audio, video — che non esistevano prima.
Come ci riesce? I modelli generativi vengono addestrati su enormi quantità di dati (per i modelli linguistici: miliardi di pagine di testo da internet, libri, articoli scientifici). Durante l'addestramento, il modello impara a predire cosa viene dopo: dato un pezzo di testo, qual è la parola — o più precisamente il token — più probabile che segua?
Questo processo, ripetuto miliardi di volte su dati enormi, produce qualcosa di sorprendente: il modello non impara solo a "incollare" frasi, ma sviluppa una comprensione implicita della grammatica, della logica, dei fatti, dello stile. Non perché qualcuno l'abbia programmato, ma perché tutto questo emerge dall'imparare a predire testo in modo accurato.
Per predire bene il testo successivo, il modello deve "capire" il significato di quello precedente. La comprensione emerge dalla predizione — non è un obiettivo dichiarato, è un sottoprodotto necessario.
Token e probabilità:
il meccanismo concreto.
Non parole, non lettere: token. E ogni token viene scelto con una probabilità, non con certezza.
Un token è l'unità base con cui un LLM elabora il testo. Non corrisponde esattamente a una parola: può essere una parola intera, una parte di parola, uno spazio, un segno di punteggiatura. In inglese, una regola approssimativa è 1 token ≈ ¾ di parola. In italiano e in lingue con morfologia più ricca, i token sono spesso più frazionati.
Perché conta saperlo? Perché i modelli hanno un limite di contesto (quanti token "vedono" contemporaneamente), e perché capire la tokenizzazione aiuta a costruire prompt migliori.
* valori indicativi a scopo illustrativo. La temperatura del modello regola quanto "rischiare" scelte meno probabili.
LLM e allucinazioni:
perché il modello inventa.
Un Large Language Model non mente deliberatamente. Fa qualcosa di più sottile e per certi versi più pericoloso.
Cos'è un Large Language Model
Un LLM (Large Language Model, Modello Linguistico di Grandi Dimensioni) è un modello di deep learning addestrato su enormi quantità di testo con l'obiettivo di predire token successivi. "Large" si riferisce al numero di parametri — i pesi interni del modello che vengono aggiustati durante l'addestramento. GPT-4, Gemini Ultra, Claude 3: tutti LLM.
La caratteristica definitoria è che non hanno una memoria esplicita dei fatti. Non c'è un database interno che consultano. Quello che sanno è distribuito, in modo diffuso e opaco, nei miliardi di parametri della rete.
Perché "allucinano"
Il termine tecnico è hallucination: il modello produce informazioni che sembrano plausibili ma sono false. Questo accade perché il suo obiettivo primario non è "essere vero" ma "essere coerente con il pattern linguistico". Se non ha una risposta, ne costruisce una che suona bene — perché questo è esattamente quello per cui è stato addestrato.
Non è un bug che si può correggere facilmente. È una conseguenza diretta del meccanismo di funzionamento. I modelli più recenti lo fanno meno, ma non lo eliminano.
Fatti verificabili
Date, nomi, citazioni, statistiche, riferimenti bibliografici. Verificare sempre. Il modello può inventare una fonte che suona perfettamente accademica.
Ragionamento logico
Su problemi matematici o logici complessi, il modello può sbagliare pur mostrando un procedimento apparentemente corretto.
Testi e strutture
Generare testo, riformulare, strutturare idee, creare varianti di un documento: qui le allucinazioni contano meno perché non c'è un "vero" da confrontare.
Insegnare a riconoscere le allucinazioni è una delle competenze digitali più preziose che possiamo trasmettere. Non "l'AI sbaglia", ma "l'AI produce output plausibili — sta a noi verificare".
Il contesto:
la memoria del modello.
Il motivo per cui lo stesso modello risponde in modo completamente diverso a seconda di come scrivi.
Ogni volta che apri una nuova conversazione con un LLM, il modello non ricorda nulla delle sessioni precedenti. Non ha memoria persistente. Quello che "vede" è solo il testo attuale della conversazione — il cosiddetto contesto o context window.
La finestra di contesto misura quanti token il modello può processare contemporaneamente: prompt di sistema, tutta la storia della conversazione, la tua domanda, la sua risposta. I modelli moderni hanno finestre enormi (alcune centinaia di migliaia di token), ma il limite esiste e ha conseguenze pratiche.
Cosa significa per te? Che il modo in cui scrivi il prompt cambia radicalmente la risposta. Non perché il modello sia capriccioso, ma perché tutto il suo ragionamento parte dal testo che legge in quel momento. Un prompt vago produce risposte vaghe. Un prompt con contesto, ruolo e obiettivo produce risposte calibrate e utili.
In una conversazione molto lunga, i modelli tendono a "dimenticare" le istruzioni date all'inizio — non perché le ignorino, ma perché quelle parti del contesto diventano meno influenti. Nelle sessioni di lavoro complesse, conviene ripetere le istruzioni chiave.
I principali modelli:
differenze pratiche.
ChatGPT, Gemini, Claude, Llama — non sono la stessa cosa. Ecco cosa cambia per chi insegna.
Non esiste il modello "migliore" in assoluto. La scelta dipende da cosa vuoi fare, da chi sono i tuoi studenti e da che strumenti usa già la tua scuola. Inizia da quello che hai già a disposizione — la logica di funzionamento è la stessa per tutti.
Privacy e dati:
cosa succede quando scrivi.
Una domanda che ogni docente dovrebbe saper rispondere prima di usare questi strumenti in classe.
Scrivi il prompt
Il testo che invii lascia il tuo dispositivo e viaggia verso i server dell'azienda.
Elaborazione in cloud
Il modello elabora la tua richiesta su server remoti — generalmente negli USA o in Europa.
Log e conservazione
Le conversazioni vengono conservate per periodi variabili. Alcuni provider le usano per il training futuro (salvo opt-out).
Risposta
Il testo generato ti viene restituito. Il tuo prompt originale rimane nei log del provider.
Non inserire mai dati personali di studenti minorenni nei prompt di servizi AI commerciali senza aver verificato la conformità al GDPR e alle policy della piattaforma. Nomi, valutazioni, situazioni familiari, condizioni di salute: niente di tutto questo nei prompt. La maggior parte dei provider offre opzioni per disattivare il training sui tuoi dati — vale la pena attivarle.
Prompt anonimi e scenari fittizi
Puoi usare l'AI per preparare materiali su uno studente generico ("uno studente di terza media con difficoltà in matematica") senza inserire dati reali. Il risultato è ugualmente utile, il rischio privacy azzerato.
Accordi istituzionali
Molte piattaforme (Microsoft con Azure OpenAI, Google Workspace for Education) offrono contratti specifici per istituzioni educative con garanzie GDPR. Verificare con il proprio DPO prima di adottare strumenti per uso istituzionale.
o lo simula in modo indistinguibile?
È la domanda che i tuoi colleghi di filosofia faranno — giustamente. E non ha una risposta definitiva. Ma è utile ragionarci con onestà, perché la risposta che dai influenza come usi questi strumenti e come ne parli ai tuoi studenti.
Quello che sappiamo con certezza: un LLM non ha coscienza, non ha emozioni, non ha intenzioni nel senso che attribuiamo a questi termini negli esseri umani. Non "vuole" aiutarti, non "sa" di sbagliarsi, non "prova" nulla. Ma produce output che in molti contesti sono funzionalmente equivalenti a quelli di un interlocutore intelligente.
La comprensione emerge dalla funzione
Se un sistema risponde in modo appropriato a qualsiasi domanda su un testo, disambigua metafore, coglie ironie e adatta il registro comunicativo — in che senso diremmo che "non capisce"? La comprensione potrebbe essere definita proprio da questi comportamenti.
La sintassi non è semantica
John Searle, già negli anni '80, immaginava una persona in una stanza che manipola simboli cinesi seguendo regole formali, producendo risposte corrette senza capire il cinese. Un LLM, dice questa posizione, fa esattamente questo: manipola pattern senza significato interno.
La domanda "l'AI capisce davvero?" è affascinante ma, per il docente, rischia di essere un vicolo cieco. La domanda più produttiva è: cosa sa fare, cosa non sa fare, e come posso usarlo per far pensare meglio i miei studenti? La risposta a quella domanda non dipende dalla risposta alla prima.
Ora che sai come funziona,
usalo meglio.
Conoscere il meccanismo non è un esercizio teorico. È la base per costruire un metodo didattico solido — e per insegnarlo ai tuoi studenti.