Capire l'AI — NuovaDidattica.eu

Sezione 1

Cos'è l'AI,
in tre minuti.

Prima di tutto: non è magia, non è fantascienza, non è un cervello elettronico. È uno strumento statistico molto sofisticato.

L'Intelligenza Artificiale è un campo dell'informatica che studia come far sì che i computer eseguano compiti che, se fatti da un essere umano, richiederebbero quello che chiamiamo "intelligenza": riconoscere immagini, capire il linguaggio, prendere decisioni, tradurre testi.

Il termine è volutamente vago — e questo crea molta confusione. Quando diciamo "AI" oggi, nella vita quotidiana, intendiamo quasi sempre una tecnologia specifica chiamata machine learning, e più precisamente una sua variante: il deep learning. Non stiamo parlando di un computer che "pensa" nel senso che intendiamo noi.

Una distinzione che vale la pena fissare subito: l'AI "stretta" (o narrow AI) è quello che usiamo oggi — sistemi che eccellono in un compito preciso. Riconoscere volti, giocare a scacchi, rispondere a domande. L'AI "generale" (AGI), quella dei film, che ragiona su qualsiasi problema come un essere umano, non esiste ancora. Quello che vediamo con ChatGPT o Gemini è AI stretta, molto potente, ma stretta.

Da tenere a mente

L'AI non "sa" nulla nel senso in cui lo sa un essere umano. Ha trovato pattern statistici in miliardi di testi. La differenza sembra sottile, ma cambia tutto nel modo in cui la usiamo e nei suoi limiti.

🎯

Narrow AI

AI stretta

Eccelle in un dominio specifico. ChatGPT è bravissimo a generare testo, ma non sa guidare un'auto. Un'AI per la guida autonoma non sa scrivere poesie.

🧠

AGI (non ancora)

AI Generale

Un sistema ipotetico che ragiona su qualsiasi problema come un essere umano. Non esiste. I modelli attuali ne simulano alcuni aspetti, ma rimangono fondamentalmente diversi.

📊

La base di tutto

Pattern statistici

Tutta l'AI moderna è, alla radice, statistica applicata a grandi quantità di dati. L'eleganza del risultato nasconde la semplicità (relativa) del meccanismo.

Sezione 2

Machine Learning
e Deep Learning.

Due livelli dello stesso concetto. La differenza sta in come il sistema impara dai dati.

Il Machine Learning (apprendimento automatico) è l'idea che un computer possa migliorare le proprie performance su un compito senza essere programmato esplicitamente per ogni caso. Invece di scrivere regole, si mostrano esempi: migliaia di email spam e non-spam, e il sistema impara da solo a distinguerle.

Il Deep Learning è una sottocategoria del ML che usa reti neurali artificiali con molti "strati" di elaborazione. Il nome "neurale" è una metafora: si ispirano vagamente al funzionamento dei neuroni, ma sono molto più semplici. Quello che conta è che ogni strato estrae caratteristiche sempre più astratte dai dati. Il primo strato riconosce linee, il secondo forme, il terzo occhi, il quarto visi — e così via, senza che nessun programmatore abbia mai scritto "cerca un occhio".

È questa capacità di trovare caratteristiche astratte autonomamente che ha reso il deep learning rivoluzionario. E che lo rende anche opaco: spesso non sappiamo esattamente perché un modello prende una certa decisione. Lo chiamiamo il problema della "scatola nera".

Metafora utile

Il bambino che impara a camminare

Non lo programmiamo con le regole della deambulazione. Gli diamo esempi (vede gli adulti), feedback (cade, si rialza), e impara. Il ML funziona in modo anaogo: esempi + feedback + aggiustamenti ripetuti.

Il limite da ricordare

La scatola nera

Un modello di deep learning può raggiungere il 99% di accuratezza su un compito e noi non riusciamo ancora a spiegare esattamente perché. Questo è un problema serio per l'uso in contesti ad alto rischio (medicina, giustizia).

Sezione 3

AI Generativa:
come funziona davvero.

Non recupera informazioni da un database. Le costruisce, parola per parola, ogni volta.

L'AI "classica" era prevalentemente discriminativa: dati in entrata → classificazione in uscita (questa foto è un gatto o un cane?). L'AI generativa fa qualcosa di diverso: produce nuovi contenuti — testi, immagini, audio, video — che non esistevano prima.

Come ci riesce? I modelli generativi vengono addestrati su enormi quantità di dati (per i modelli linguistici: miliardi di pagine di testo da internet, libri, articoli scientifici). Durante l'addestramento, il modello impara a predire cosa viene dopo: dato un pezzo di testo, qual è la parola — o più precisamente il token — più probabile che segua?

Questo processo, ripetuto miliardi di volte su dati enormi, produce qualcosa di sorprendente: il modello non impara solo a "incollare" frasi, ma sviluppa una comprensione implicita della grammatica, della logica, dei fatti, dello stile. Non perché qualcuno l'abbia programmato, ma perché tutto questo emerge dall'imparare a predire testo in modo accurato.

L'intuizione chiave

Per predire bene il testo successivo, il modello deve "capire" il significato di quello precedente. La comprensione emerge dalla predizione — non è un obiettivo dichiarato, è un sottoprodotto necessario.

Sezione 4

Token e probabilità:
il meccanismo concreto.

Non parole, non lettere: token. E ogni token viene scelto con una probabilità, non con certezza.

Un token è l'unità base con cui un LLM elabora il testo. Non corrisponde esattamente a una parola: può essere una parola intera, una parte di parola, uno spazio, un segno di punteggiatura. In inglese, una regola approssimativa è 1 token ≈ ¾ di parola. In italiano e in lingue con morfologia più ricca, i token sono spesso più frazionati.

Perché conta saperlo? Perché i modelli hanno un limite di contesto (quanti token "vedono" contemporaneamente), e perché capire la tokenizzazione aiuta a costruire prompt migliori.

Esempio di tokenizzazione — la frase viene spezzata così

L'intelligenza artificiale non è magia, è statistica applicata su scala enorme.

Token da parte di parola

Token da parola intera

Token funzionale

Token con punteggiatura

Come il modello sceglie la parola successiva

Prompt: "L'AI nella didattica dovrebbe essere usata con…"

consapevolezza

52%

criterio

24%

cautela

13%

attenzione

altre parole

* valori indicativi a scopo illustrativo. La temperatura del modello regola quanto "rischiare" scelte meno probabili.

Approfondimento

L'effetto omologazione: perché le risposte dell'AI si assomigliano tutte

Il meccanismo appena visto spiega anche un fenomeno di cui si parla sempre di più: usata senza attenzione, l'AI produce testi che si somigliano tutti — stesso tono rassicurante, stesse frasi fatte, la stessa prudenza diplomatica. Non è un difetto nascosto del modello, è la conseguenza diretta di come funziona: per costruire ogni token il sistema pesca quasi sempre dall'opzione statisticamente più probabile. E la più probabile è, per definizione, anche la più prevedibile — una media calcolata su miliardi di testi, non una voce originale.

Un prompt generico riceve dunque la risposta più "media" che il modello sa produrre. Chiedere genericamente più originalità non basta: serve introdurre nel prompt un attrito volontario che allontani la scelta dal token più probabile. Chi scrive il prompt deve lavorare più da regista che da committente — specificando non solo cosa produrre, ma soprattutto cosa evitare.

Vincolo negativo

Dì cosa evitare

Escludere per iscritto le uscite più probabili funziona meglio che sperare in un'originalità generica: "senza aggettivi lirici", "senza conclusioni morali", "senza la metafora di [X]".

Prospettiva vincolata

Fissa un punto di osservazione

Un tema generico lascia il modello libero di scegliere la media. Un punto di vista preciso no: "scrivi dal punto di vista di chi ha fretta", "usa solo suoni e odori, niente immagini visive".

Sintassi imposta

Rompi la forma

Vincolare la forma — frasi sotto le cinque parole, stile telegrafico, un solo segno di punteggiatura ammesso — cambia a cascata anche le scelte lessicali, non solo il ritmo.

Per il docente

Vale anche in classe: mostrare agli studenti che due prompt quasi identici restituiscono testi quasi identici è il modo più diretto per far capire la differenza tra un testo e una media statistica — e che scriverne uno che non sia scontato richiede la stessa cura registica appena descritta.

Sezione 5

LLM e allucinazioni:
perché il modello inventa.

Un Large Language Model non mente deliberatamente. Fa qualcosa di più sottile e per certi versi più pericoloso.

Cos'è un Large Language Model

Un LLM (Large Language Model, Modello Linguistico di Grandi Dimensioni) è un modello di deep learning addestrato su enormi quantità di testo con l'obiettivo di predire token successivi. "Large" si riferisce al numero di parametri — i pesi interni del modello che vengono aggiustati durante l'addestramento. GPT-4, Gemini Ultra, Claude 3: tutti LLM.

La caratteristica definitoria è che non hanno una memoria esplicita dei fatti. Non c'è un database interno che consultano. Quello che sanno è distribuito, in modo diffuso e opaco, nei miliardi di parametri della rete.

Perché "allucinano"

Il termine tecnico è hallucination: il modello produce informazioni che sembrano plausibili ma sono false. Questo accade perché il suo obiettivo primario non è "essere vero" ma "essere coerente con il pattern linguistico". Se non ha una risposta, ne costruisce una che suona bene — perché questo è esattamente quello per cui è stato addestrato.

Non è un bug che si può correggere facilmente. È una conseguenza diretta del meccanismo di funzionamento. I modelli più recenti lo fanno meno, ma non lo eliminano.

Rischio alto

Fatti verificabili

Date, nomi, citazioni, statistiche, riferimenti bibliografici. Verificare sempre. Il modello può inventare una fonte che suona perfettamente accademica.

Rischio medio

Ragionamento logico

Su problemi matematici o logici complessi, il modello può sbagliare pur mostrando un procedimento apparentemente corretto.

Rischio basso

Testi e strutture

Generare testo, riformulare, strutturare idee, creare varianti di un documento: qui le allucinazioni contano meno perché non c'è un "vero" da confrontare.

Per il docente

Insegnare a riconoscere le allucinazioni è una delle competenze digitali più preziose che possiamo trasmettere. Non "l'AI sbaglia", ma "l'AI produce output plausibili — sta a noi verificare".

Sezione 6

Il contesto:
la memoria del modello.

Il motivo per cui lo stesso modello risponde in modo completamente diverso a seconda di come scrivi.

Ogni volta che apri una nuova conversazione con un LLM, il modello non ricorda nulla delle sessioni precedenti. Non ha memoria persistente. Quello che "vede" è solo il testo attuale della conversazione — il cosiddetto contesto o context window.

La finestra di contesto misura quanti token il modello può processare contemporaneamente: prompt di sistema, tutta la storia della conversazione, la tua domanda, la sua risposta. I modelli moderni hanno finestre enormi (alcune centinaia di migliaia di token), ma il limite esiste e ha conseguenze pratiche.

Cosa significa per te? Che il modo in cui scrivi il prompt cambia radicalmente la risposta. Non perché il modello sia capriccioso, ma perché tutto il suo ragionamento parte dal testo che legge in quel momento. Un prompt vago produce risposte vaghe. Un prompt con contesto, ruolo e obiettivo produce risposte calibrate e utili.

Visualizzazione della finestra di contesto ogni blocco = ~100 token

Prompt sistema

Storico chat

Domanda attuale

Spazio libero

Finestra attiva: ~1.030 token su ~128.000 disponibili

Implicazione pratica

In una conversazione molto lunga, i modelli tendono a "dimenticare" le istruzioni date all'inizio — non perché le ignorino, ma perché quelle parti del contesto diventano meno influenti. Nelle sessioni di lavoro complesse, conviene ripetere le istruzioni chiave.

Sezione 7

I principali modelli:
differenze pratiche.

ChatGPT, Gemini, Claude, Llama — non sono la stessa cosa. Ecco cosa cambia per chi insegna.

ChatGPT / GPT-4o

OpenAI · Dal 2022

Il più conosciuto, con la base utenti più ampia

Ottimo per redazione, sintesi e brainstorming

Interpreta immagini, genera immagini (DALL·E), analizza file

Disponibile free con limiti, abbonamento Plus per i modelli avanzati

Punto di forza didattico: ecosistema ampio, facile da adottare in classe

Gemini

Google DeepMind · Dal 2023

Integrato con Google Workspace (Docs, Drive, Gmail)

Accesso nativo al web in tempo reale

Finestra di contesto molto ampia (fino a 1 milione di token)

Gratuito in versione base, abbonamento Google One per Gemini Advanced

Punto di forza didattico: integrazione con gli strumenti Google già usati a scuola

Claude

Anthropic · Dal 2023

Progettato con focus su sicurezza e comportamento affidabile

Eccellente per ragionamento lungo e analisi di documenti

Finestra di contesto molto ampia, ottimo per testi lunghi

Gratuito in versione base, abbonamento Pro per i modelli avanzati

Punto di forza didattico: risposte più caute e sfumate su argomenti sensibili

Llama / Modelli open

Meta e altri · Open source

Codice sorgente e pesi disponibili pubblicamente

Possono essere eseguiti localmente, senza inviare dati a nessun server

Richiedono hardware adeguato o piattaforme intermedie

Opzione interessante per istituzioni con requisiti di privacy severi

Punto di forza didattico: privacy massima, nessun abbonamento, personalizzabili

Consiglio per iniziare

Non esiste il modello "migliore" in assoluto. La scelta dipende da cosa vuoi fare, da chi sono i tuoi studenti e da che strumenti usa già la tua scuola. Inizia da quello che hai già a disposizione — la logica di funzionamento è la stessa per tutti.

Sezione 8

Privacy e dati:
cosa succede quando scrivi.

Una domanda che ogni docente dovrebbe saper rispondere prima di usare questi strumenti in classe.

Scrivi il prompt

Il testo che invii lascia il tuo dispositivo e viaggia verso i server dell'azienda.

→

Elaborazione in cloud

Il modello elabora la tua richiesta su server remoti — generalmente negli USA o in Europa.

→

Log e conservazione

Le conversazioni vengono conservate per periodi variabili. Alcuni provider le usano per il training futuro (salvo opt-out).

→

Risposta

Il testo generato ti viene restituito. Il tuo prompt originale rimane nei log del provider.

⚠️

Non inserire mai dati personali di studenti minorenni nei prompt di servizi AI commerciali senza aver verificato la conformità al GDPR e alle policy della piattaforma. Nomi, valutazioni, situazioni familiari, condizioni di salute: niente di tutto questo nei prompt. La maggior parte dei provider offre opzioni per disattivare il training sui tuoi dati — vale la pena attivarle.

Alternativa sicura

Prompt anonimi e scenari fittizi

Puoi usare l'AI per preparare materiali su uno studente generico ("uno studente di terza media con difficoltà in matematica") senza inserire dati reali. Il risultato è ugualmente utile, il rischio privacy azzerato.

Per le scuole

Accordi istituzionali

Molte piattaforme (Microsoft con Azure OpenAI, Google Workspace for Education) offrono contratti specifici per istituzioni educative con garanzie GDPR. Verificare con il proprio DPO prima di adottare strumenti per uso istituzionale.

Sezione 9 · La domanda difficile

L'AI capisce quello che scrive,
o lo simula in modo indistinguibile?

È la domanda che i tuoi colleghi di filosofia faranno — giustamente. E non ha una risposta definitiva. Ma è utile ragionarci con onestà, perché la risposta che dai influenza come usi questi strumenti e come ne parli ai tuoi studenti.

Quello che sappiamo con certezza: un LLM non ha coscienza, non ha emozioni, non ha intenzioni nel senso che attribuiamo a questi termini negli esseri umani. Non "vuole" aiutarti, non "sa" di sbagliarsi, non "prova" nulla. Ma produce output che in molti contesti sono funzionalmente equivalenti a quelli di un interlocutore intelligente.

Argomento funzionalista

La comprensione emerge dalla funzione

Se un sistema risponde in modo appropriato a qualsiasi domanda su un testo, disambigua metafore, coglie ironie e adatta il registro comunicativo — in che senso diremmo che "non capisce"? La comprensione potrebbe essere definita proprio da questi comportamenti.

Argomento della stanza cinese

La sintassi non è semantica

John Searle, già negli anni '80, immaginava una persona in una stanza che manipola simboli cinesi seguendo regole formali, producendo risposte corrette senza capire il cinese. Un LLM, dice questa posizione, fa esattamente questo: manipola pattern senza significato interno.

La posizione di NuovaDidattica

La domanda "l'AI capisce davvero?" è affascinante ma, per il docente, rischia di essere un vicolo cieco. La domanda più produttiva è: cosa sa fare, cosa non sa fare, e come posso usarlo per far pensare meglio i miei studenti? La risposta a quella domanda non dipende dalla risposta alla prima.

Ora che sai come funziona,
usalo meglio.

Conoscere il meccanismo non è un esercizio teorico. È la base per costruire un metodo didattico solido — e per insegnarlo ai tuoi studenti.

Scopri il metodo Vai al Toolbox

Cos'è l'AI,in tre minuti.

AI stretta

AI Generale

Pattern statistici

Machine Learninge Deep Learning.

Il bambino che impara a camminare

La scatola nera

AI Generativa:come funziona davvero.

Token e probabilità:il meccanismo concreto.

L'effetto omologazione: perché le risposte dell'AI si assomigliano tutte

Dì cosa evitare

Fissa un punto di osservazione

Rompi la forma

LLM e allucinazioni:perché il modello inventa.

Cos'è un Large Language Model

Perché "allucinano"

Fatti verificabili

Ragionamento logico

Testi e strutture

Il contesto:la memoria del modello.

I principali modelli:differenze pratiche.

Privacy e dati:cosa succede quando scrivi.

Scrivi il prompt

Elaborazione in cloud

Log e conservazione

Risposta

Prompt anonimi e scenari fittizi

Accordi istituzionali

La comprensione emerge dalla funzione

La sintassi non è semantica

Ora che sai come funziona,usalo meglio.

Cos'è l'AI,
in tre minuti.

Machine Learning
e Deep Learning.

AI Generativa:
come funziona davvero.

Token e probabilità:
il meccanismo concreto.

LLM e allucinazioni:
perché il modello inventa.

Il contesto:
la memoria del modello.

I principali modelli:
differenze pratiche.

Privacy e dati:
cosa succede quando scrivi.

Ora che sai come funziona,
usalo meglio.