Privacy e intelligenza artificiale: cosa dobbiamo sapere nel 2025
Diciamocelo: ormai interagire con un chatbot – che sia ChatGPT, Gemini, Claude o uno dei mille assistenti virtuali – è diventato quasi come fare una chiacchierata al bar. Solo che, al posto del barista, c’è un algoritmo che ci risponde in un italiano perfetto (o quasi). Studenti, insegnanti, genitori, professionisti – chi più chi meno – ci siamo messi a “parlare” con queste IA per fare domande, chiedere aiuto, o semplicemente toglierci una curiosità. Ma sai cosa? Ogni volta che parliamo con un LLM – un modello linguistico generativo, per usare il termine tecnico – stiamo lasciando dietro di noi una scia di dati. Un po’ come se, dopo aver chiesto al barista un consiglio, scoprissimo che stava registrando la nostra conversazione per studiarci meglio.
E qui si apre un tema enorme: la privacy. Perché questi strumenti, sì, sono incredibili – ma a che prezzo? Quali dati cediamo, consapevoli o meno, quando chiediamo un consiglio per l’ansia, carichiamo la foto di famiglia su un generatore d’immagini, o raccontiamo una situazione privata al chatbot? Questo articolo (che sì, è lungo, ma merita) prova a fare chiarezza e stimolare qualche riflessione. Analizzeremo i rischi, le leggi in gioco – il GDPR, l’AI Act – e ci faremo anche qualche domanda scomoda: cosa fanno le Big Tech con i nostri dati? E noi, ci dobbiamo preoccupare?
Prima però, fermiamoci un attimo a guardare i rischi veri. Quelli meno ovvi. Quelli che spesso ignoriamo mentre chattiamo con l’IA pensando “tanto è solo un robot”.
Non è roba da smanettoni o da esperti: riguarda tutti noi. Studenti, insegnanti, genitori, professionisti, chiunque usi questi strumenti per lavorare, imparare o semplicemente divertirsi. Perché l’IA non è più “roba da laboratorio”: è parte della nostra vita di tutti i giorni. E capire come funziona – e come può influire sulla nostra privacy – è un modo per proteggere non solo i nostri dati, ma anche la nostra libertà di essere chi siamo, senza che un algoritmo ci metta in un’etichetta.
I rischi principali: una panoramica pratica
Partiamo dalle basi. Usare uno strumento di Intelligenza artificiale, per esempio un Large Language Model come ChatGPT, non è come scrivere sul quaderno: è come parlare in un microfono acceso, con qualcuno (o qualcosa) che sta ascoltando, registrando e, talvolta, imparando da quello che diciamo. Ecco una carrellata di rischi, spiegati in modo semplice – con esempi reali, perché non stiamo parlando di teorie campate in aria.
⚠️ Condivisione involontaria di dati
Quando scrivi “Ehi ChatGPT, dammi un consiglio per il compleanno del mio amico Marco, che soffre di ansia”? Ecco: in quel momento hai appena dato due informazioni personali – il nome di Marco e un dato sensibile sulla sua salute. Magari non ci hai fatto caso, ma il chatbot (e chi lo gestisce) le ha registrate. E potrebbero rimanere lì, nei log, anche per mesi.
⚠️Prompt conservati e riutilizzati
Le conversazioni con gli LLM non spariscono nel nulla. Spesso vengono archiviate e usate per “insegnare” al modello a migliorare. Quindi il tuo messaggio, la tua storia, le tue domande – potrebbero contribuire ad addestrare la prossima versione di quel chatbot. Se pensi che basti cancellare la cronologia per stare tranquilli, sappi che anche in quel caso i dati potrebbero rimanere salvati per 30 giorni (come succedeva e succede anche con alcuni piani con ChatGPT) oppure anche per sempre.
⚠️Occhi umani dietro le quinte
Non c’è solo l’algoritmo: a volte, per migliorare l’IA, ci sono anche persone in carne e ossa che leggono pezzi delle conversazioni. Certo, si parla di chat “anonimizzate”, ma se scrivi “Mio figlio Lorenzo fa le medie a Roma e ha problemi con la matematica”, quei dati, anche senza il tuo nome, sono comunque riconoscibili. E magari finiscono davanti agli occhi di un revisore umano, chissà dove nel mondo.
⚠️Tracciamento invisibile e fingerprinting
Un po’ come quando navighi su un sito e ti senti “seguito” dagli annunci, anche qui i sistemi IA raccolgono informazioni di contorno: il tuo IP, il browser, il dispositivo, perfino quanto tempo rimani su una pagina o a che ora scrivi. Tutti dettagli che, messi insieme, costruiscono un profilo abbastanza dettagliato – e tu magari nemmeno te ne accorgi. È come lasciare briciole digitali che qualcun altro raccoglie.
⚠️ Profilazione implicita
Anche senza dirlo esplicitamente, il chatbot può “capire” cose su di te. Se gli chiedi spesso consigli su sintomi di malattie, oppure parli di viaggi in determinati Paesi, o di hobby particolari, il sistema può dedurre – e magari registrare – che sei interessato a quelle cose. E questo profilo, se finisce in mani sbagliate o viene usato per scopi di marketing, o peggio azioni di condizionamento e diventa un problema serio.
⚠️ Perdita di controllo sui dati
Una volta che i tuoi dati entrano in un sistema IA , non c’è più modo di riprenderli indietro. Sono archiviati su server, magari in un altro continente, e chi garantisce che non vengano usati in futuro per scopi diversi? Pensiamo, ad esempio, a una mamma che carica foto di famiglia su un generatore di immagini IA: quelle immagini potrebbero essere usate per altro, e se domani c’è una violazione o un cambio di policy, potrebbero anche finire in mani sbagliate.
⚠️ Memorizzazione nascosta e rischio leak
Ecco il punto forse più inquietante: i modelli IA apprendono dai dati, e talvolta possono “ricordare” dettagli sensibili, anche se non dovrebbero. Ci sono stati casi in cui i ricercatori hanno dimostrato che un chatbot poteva rigenerare numeri di carte di credito usate durante l’addestramento. E se capita con una carta, perché non con il tuo indirizzo email o il nome del tuo amico Marco?
⚠️ Repsonsabilità per condivisione di dati riservati
Argomento decisamente problematico. Quando condividi con il chatbot un pdf, l'email (magari con dati personali altrui), il codice sorgente, un file excel che desideri rielaborare o riassumere ? Sei sicuro di poterlo fare ? Stai condividendo materiale generico o materiale riservato, magari protetto da diritti autore o segreto industriale? Occorre riflettere e porre attenzione sui materiali che maneggiamo in relazione agli strumenti che utlizziamo. Nel dubbio vale la regola - evitare.
⚠️ Allucinazioni problematiche o pericolose
Le IA non sono infallibili. Possono “inventare” dati – e a volte, quei dati inventati riguardano persone vere. Se il chatbot ti dà la data di nascita sbagliata di un politico, o ti attribuisce un titolo di studio che non hai mai conseguito, si tratta di un problema serio di accuratezza. E correggere questi errori? Spesso impossibile, perché l’IA non sa nemmeno da dove ha preso quell’informazione.
⚠️ Minori e poca protezione
Non dimentichiamo i più giovani: i minorenni usano chatbot senza sempre capire i rischi. Fino al 2023, bastava inserire una data di nascita falsa per usare ChatGPT, anche se avevi 12 anni. Solo dopo interventi dei Garanti (come quello italiano) si è iniziato a introdurre controlli più robusti, ma il problema rimane: i dati dei minori finiscono spesso nel sistema, senza garanzie e consapevolezza.
⚠️ Data breach e falle di sicurezza
Infine, i bug e le violazioni. È già successo (ad esempio a marzo 2024, con ChatGPT) che per errore tecnico alcuni utenti vedessero le chat di altri – inclusi dettagli su abbonamenti e pagamenti. OpenAI all’epoca non avvisò subito tutti i Garanti europei, e questo ha portato a una multa salata. È un promemoria importante: i dati che forniamo a queste piattaforme non sono blindati, e un semplice bug può renderli visibili ad altri.
Le regole del gioco: GDPR, AI Act e il nodo della privacy nell’IA
Cosa rende il mondo dell’intelligenza artificiale così affascinante, ma anche così complicato? Il fatto che corriamo alla velocità della luce – nuovi modelli, nuove app, nuove possibilità – mentre le leggi, beh, fanno un po’ fatica a stare al passo. E non è per cattiveria: regolamentare l’IA è come provare a dare la caccia a un’ombra che cambia forma ogni volta che ti avvicini. Ma vediamo insieme cosa sta succedendo, perché se usi un chatbot, agenti o lavori con questi strumenti, capire le regole è fondamentale.
Il GDPR: una bussola ancora valida, ma con qualche ammaccatura
Partiamo da quello che già conosciamo: il Regolamento Generale sulla Protezione dei Dati (GDPR). Sì, proprio quello che ci ricorda di leggere le informative privacy (quelle chilometriche che spesso scorriamo velocemente). Il GDPR non è roba vecchia: anche nel 2025 resta la cornice principale per la protezione dei dati personali in Europa, e si applica pure ai dati trattati dagli LLM.
Perché è importante? Perché il GDPR stabilisce principi fondamentali come:
- Trasparenza: devi sapere come vengono usati i tuoi dati.
- Minimizzazione: non si possono raccogliere più dati del necessario.
- Esattezza: i dati personali devono essere corretti e aggiornati.
- Sicurezza: le aziende devono proteggere i tuoi dati da violazioni o furti.
- E, soprattutto, diritti dell’interessato: puoi chiedere di accedere ai tuoi dati, farli cancellare, correggere o opporsi al trattamento.
Ora, fin qui tutto chiaro, no? Ma il punto è che gli LLM non sono come una rubrica telefonica. Sono sistemi complessi, che apprendono da quantità immense di dati – inclusi i tuoi post sui social, i tuoi articoli, perfino quel commento lasciato dieci anni fa su un forum dimenticato. E qui casca l’asino: su quale base legale si fonda il loro addestramento?
La questione della base giuridica: legittimo interesse o consenso?
Prendiamo Meta o OpenAI e ChatGPT come esempio. Quando hanno iniziato a raccogliere dati da internet (forum, blog, pagine web) per addestrare i modelli, non hanno chiesto a nessuno. Nessuna email, nessun banner di consenso. Loro hanno detto: “Va bene così, è nel nostro legittimo interesse”.
Il problema? Beh, il GDPR non è così permissivo. Usare dati personali – anche se pubblici – per scopi di addestramento richiede una valutazione rigorosa, e forse anche il consenso esplicito degli interessati. Il Garante Privacy italiano, infatti, ha sollevato la questione: “Scusate, ma su che base giuridica avete preso e usato questi dati?”
Risultato: il caso è finito per esempio nelle mani dell’Autorità irlandese (che, per via del meccanismo del “one-stop-shop” in UE, funge da capofila per OpenAI). E qui siamo ancora in attesa di una decisione chiara, ma il messaggio è forte: le regole valgono per tutti, anche per le Big Tech. Non basta dire “è nel nostro interesse”. Serve dimostrarlo.
Trasparenza: il nodo delle informative (e la fatica di capirle)
Il GDPR impone anche che le aziende spieghino bene come usano i dati. Ma spiegare bene, cosa significa? Facciamo un esempio: per un po’, OpenAI non diceva chiaramente che i prompt degli utenti (cioè le domande fatte a ChatGPT) venivano usati per addestrare il modello. Né specificava che i dati personali inseriti nelle chat potevano finire in mano a revisori umani.
Solo dopo l’intervento del Garante italiano – con tanto di sanzione da 15 milioni di euro a dicembre 2024 – OpenAI ha dovuto aggiornare la privacy policy, avviare una campagna informativa, e mettere a disposizione opzioni per “uscire” dal training (l’opt-out). Ma resta un problema: anche se disattivi la cronologia, i tuoi dati restano per 30 giorni sui server. E, spesso, non è così semplice capire dove finiscano davvero le informazioni.
È un po’ come leggere le clausole scritte in piccolo in un contratto di assicurazione: puoi farlo, ma devi armarti di pazienza – e magari di una lente d’ingrandimento.
Esattezza e allucinazioni: quando l’IA sbaglia (e non puoi rimediare)
Un altro tema caldo è quello dell’accuratezza. Secondo il GDPR, i dati personali devono essere corretti e aggiornati. Ma con un LLM, come fai? Se il modello ha imparato che “Mario Rossi è nato nel 1978” e in realtà Mario Rossi è nato nel 1982, come correggi quell’informazione? La risposta breve è: non puoi, almeno non facilmente.
Minori e soggetti vulnerabili: tutele deboli, rischi alti
Un altro punto dolente riguarda i minori. Il GDPR dice chiaramente che per usare un servizio online sotto i 16 anni (o 13, in base allo Stato), serve il consenso dei genitori. Eppure, fino a poco tempo fa, chiunque poteva accedere a ChatGPT semplicemente inserendo una data di nascita a caso. Solo dopo il richiamo del Garante, OpenAI ha introdotto controlli più robusti (prima un semplice “age-gate”, poi un sistema più avanzato con verifica di terze parti). Ma siamo ancora in una fase di rodaggio: il sistema funziona davvero? E come si tutelano i dati dei minori una volta dentro il sistema?
Insomma, le falle ci sono. E l’impressione è che le aziende abbiano corso per lanciare i prodotti, senza preoccuparsi troppo delle regole – salvo poi correre ai ripari quando arrivano le multe.
Il nuovo arrivato: l’AI Act europeo
E ora parliamo di lui, l’AI Act, che nel 2025 è in dirittura d’arrivo come primo regolamento europeo “omnibus” sull’IA. Il GDPR resta la legge sui dati personali, ma l’AI Act interviene a monte, fissando regole per lo sviluppo e l’uso delle IA – compresi i modelli generativi come ChatGPT.
Quali sono i punti chiave? Te li riassumo così:
- Classificazione per rischio: l’IA viene divisa in categorie (inaccettabile, alto rischio, basso, minimo). Gli LLM general-purpose non sono “ad alto rischio” di per sé, ma attenzione: se usati in certi contesti (per esempio per la selezione del personale), scattano regole più stringenti.
- Trasparenza sui dati di training: i fornitori dovranno pubblicare un “riassunto” dei dati usati per addestrare il modello. Non tutti i dettagli, ma almeno un’indicazione. Questo per dare un minimo di controllo: sapere se ci sono dentro i tuoi post o quelli di qualcun altro.
- Obblighi di sicurezza: ridurre il rischio di output illegali o discriminatori.
- Etichettatura dei contenuti generati: testi, immagini, video prodotti dall’IA dovranno essere segnalati come tali, per evitare inganni e deepfake.
- Divieti specifici: per esempio, niente più scraping massivo di immagini per creare database di riconoscimento facciale, niente IA per manipolare il comportamento umano in modi dannosi.
Il messaggio è chiaro: più regole, più responsabilità. E, se non si rispettano, si rischiano multe pesanti: fino a 40 milioni di euro o il 7% del fatturato.
Ma attenzione: l’AI Act non sostituisce il GDPR. Piuttosto, ci lavora insieme: il GDPR tutela i dati a valle, l’AI Act agisce a monte. In pratica, il GDPR dice: “Se tratti dati personali, fallo bene”. L’AI Act aggiunge: “E se sviluppi l’IA, progettala in modo sicuro, trasparente e rispettoso dei diritti delle persone”.
Casi concreti: quando i rischi diventano realtà
A questo punto potresti pensare: “Ok, tutto chiaro, ma questi rischi sono solo ipotesi o sono già successe cose serie?”. Spoiler: sono successe. Eccome, e altre ne succederanno in futuro. Ecco alcuni casi che mostrano come le cose possano andare storte – anche quando si tratta di aziende multimiliardarie.
🚨 La sanzione italiana a OpenAI: un campanello d’allarme
Dicembre 2024, Italia. OpenAI si becca una multa da 15 milioni di euro per violazioni al GDPR legate a ChatGPT: mancanza di trasparenza, nessun filtro per i minori, inesattezze nei dati, e per finire, una notifica incompleta di un data breach. In pratica, OpenAI aveva creato uno strumento potentissimo, ma si era dimenticata (o aveva trascurato) le regole europee sulla privacy. La multa italiana è stata la prima di questo livello in Europa per un sistema di IA generativa. Un segnale fortissimo, quasi un messaggio in codice: “Ehi, Big Tech, svegliatevi. Le regole valgono anche per voi”.
E guarda caso, dopo questo scossone, altre autorità europee hanno iniziato a muoversi, e il Comitato Europeo per la Protezione dei Dati (EDPB) ha creato una task force su ChatGPT. Segno che, ormai, l’attenzione è alta.
🚨 Il reclamo NOYB in Austria: l’IA non è infallibile
Altro caso interessante: il reclamo presentato da NOYB (l’associazione fondata da Max Schrems, un nome che chi si occupa di privacy conosce bene) contro OpenAI in Austria. Il problema? Un personaggio pubblico ha chiesto a ChatGPT informazioni su di sé e ha ricevuto dati sbagliati. Ha provato a far correggere l’errore, ma niente da fare: OpenAI ha detto che non può né modificare i dati generati né sapere esattamente da dove provengano.
🚨 Il bug di ChatGPT (2023): quando le chat private diventano pubbliche
Marzo 2023. Un bug tecnico su ChatGPT permette ad alcuni utenti di vedere i titoli delle conversazioni di altri e, in certi casi, dettagli di pagamento. Roba che fa venire i brividi, perché ci ricorda che nulla è davvero privato su queste piattaforme. OpenAI ha dovuto correre ai ripari, ma ha commesso un errore grave: non ha notificato subito il data breach a tutte le autorità europee, come richiesto dal GDPR. Questo ha pesato nella sanzione italiana del 2024.
🚨 Samsung e il divieto interno: un caso significativo
Ad aprile 2023, alcuni ingegneri di Samsung – probabilmente in buona fede – hanno caricato pezzi di codice sorgente su ChatGPT per farsi aiutare nel debug. Risultato? Quello stesso codice è finito nei log del chatbot e potenzialmente potrebbe essere stato usato per addestrare modelli futuri. Immagina: un segreto industriale che finisce in un sistema terzo fuori dal tuo controllo. La reazione di Samsung? Un divieto netto: niente più chatbot sulle reti aziendali e sui dispositivi interni. E non sono stati i soli: anche banche come JPMorgan e aziende come Apple hanno preso provvedimenti rigorosi simili. Queste casistiche evidenziano un rischio privacy “indiretto”: non tanto la violazione dei dati personali, quanto la perdita di confidenzialità di dati aziendali (che spesso includono anche dati personali di clienti) quando si usano LLM senza cautele o pensiero critico.
🚨 Zoom e l’aggiornamento delle policy: quando “consenso” diventa un concetto elastico
Estate 2023: Zoom aggiorna i suoi termini di servizio e sembra voler usare audio, video e chat delle riunioni per addestrare le proprie IA. Scoppia il caso: utenti e media insorgono, e Zoom fa marcia indietro (almeno in parte). Ma la faccenda resta ambigua: perché se tu, come organizzatore della riunione, accetti certe funzionalità IA (come la trascrizione automatica), di fatto stai anche dando il consenso all’uso dei dati per il training. I partecipanti? Se non vogliono che le loro parole vengano usate, devono semplicemente… non partecipare alla riunione. È un po’ come firmare un contratto senza possibilità di negoziare le clausole: o prendi tutto o niente.
Le strategie delle Big Tech: tra “data grabbing” e correzioni tardive
Ora, fermiamoci un attimo. Perché le Big Tech fanno quello che fanno? È semplice: i modelli generativi – ChatGPT, Claude, Gemini, e compagnia – hanno fame di dati. E non di due spiccioli: servono trilioni di parole, milioni di immagini, video, registrazioni audio. Più dati hai, più il modello è potente.
Il problema è che per un po’ le regole sono state ignorate. OpenAI, Google, Meta – tutti hanno fatto scraping selvaggio del web: post, articoli, commenti, banche dati opache, perfino dati personali come email o numeri di telefono lasciati su forum dimenticati. E hanno usato questi dati senza chiedere nulla a nessuno. Quando le proteste sono iniziate – autori, artisti, giornalisti, cittadini comuni – le aziende hanno cominciato a fare un passo indietro (o quasi).
OpenAI ha smesso di elencare dettagli sui dataset usati per GPT-4, dopo averlo fatto per GPT-3. Perché? Dicono per ragioni di sicurezza e competizione, ma la verità è che meno si dice, meno problemi si rischia.
Google, invece, ha aggiornato la sua privacy policy per dire chiaramente che usa “dati pubblicamente disponibili” per addestrare l’IA. Ma cosa significa “pubblicamente disponibili”? Anche un post su un blog personale è pubblico, ma non vuol dire che chi lo ha scritto voglia vederlo usato per addestrare un chatbot. È un terreno scivoloso, e il rischio di cause legali è concreto: nel 2023, ad esempio, ci sono state class action contro OpenAI e Meta per l’uso di contenuti protetti da copyright nei training set.
Poi ci sono le correzioni di rotta. OpenAI, dopo il caso italiano, ha introdotto un modulo per richiedere la cancellazione dei dati personali dai risultati di ChatGPT. Un passo avanti, certo. Ma resta una domanda: chi controlla davvero che questi dati vengano rimossi? E in quanti sanno che possono fare questa richiesta?
Intanto, le aziende stanno anche sperimentando nuove strategie: partnership con editori (ad esempio OpenAI con Associated Press), licenze con piattaforme come Shutterstock, e modelli “business” a pagamento che promettono più privacy. È come se la privacy stesse diventando un servizio premium: se paghi, ti proteggiamo i dati; se usi il servizio gratuito, sappi che i tuoi dati potrebbero servire a migliorare il modello, del resto, come ci ricorda Friedman, in economia “non esistono pasti gratis” e quando stai utilizzando qualcosa di gratuito probabilmente il prodotto sei tu.
E noi? Cosa possiamo fare per proteggerci?
A questo punto ci si potrebbe sentire un po’ sopraffatti. Ma non è tutto fuori dal nostro controllo. Ci sono cose concrete che possiamo fare per proteggerci, come utenti e come cittadini.
- Non condividere dati sensibili nelle chat IA: sembra banale, ma spesso ci dimentichiamo che anche un messaggio apparentemente innocuo (“Mio figlio fa la terza media a Milano e ha problemi con la matematica”) contiene dati personali. Meglio evitare.
- Controllare le impostazioni di privacy: molti servizi, come ChatGPT, ora offrono opzioni per non salvare la cronologia o non contribuire al training. In alcuni casi sono nascoste. Usale. E, quando i servizi lo consentono, cancellare la cronologia o disattivare la memoria.
- Leggere (almeno una volta) le informative privacy: lo sappiamo, è noioso. Ma almeno una volta proviamo a darci un’occhiata: ci sono spesso dettagli importanti. Atrettanto spesso però cambiano e quindi vanno rilette ogni tanto.
- Esercitare i tuoi diritti: puoi chiedere di accedere ai tuoi dati, di cancellarli, o di opporti al trattamento. È un tuo diritto – usalo.
- Se sei un educatore o un genitore, parla di questi temi con i ragazzi: sono loro i primi a usare queste tecnologie, spesso senza rendersene conto. Un po’ di consapevolezza in più può fare la differenza.
In fondo, privacy e IA non sono nemici
Lo so, la tentazione è pensare che la privacy e l’IA siano due cose in conflitto: o proteggi i tuoi dati o usi la tecnologia. Ma non deve per forza essere così. Possiamo (e dobbiamo) trovare un equilibrio: costruire IA potenti e utili, ma rispettose della nostra sfera privata, sopratutto etiche e non discriminatorie.
Le leggi ci sono – il GDPR, l’AI Act – ma da sole non bastano. Servono aziende più trasparenti, utenti più consapevoli, e autorità più reattive. È una sfida collettiva.
Una cosa è certa: più conosciamo questi strumenti, più possiamo usarli in modo intelligente, senza rinunciare ai nostri diritti. Non dobbiamo smettere di fare domande, di pretendere chiarezza, di chiedere “Scusate, ma i miei dati dove vanno a finire?”. È solo così che l’IA diventerà davvero uno strumento al nostro servizio, e non il contrario.
Quanti dati sa di te l’IA? Più di quanto immagini (ma meno di quanto pensi)
È una domanda che inizia a girare sempre più spesso tra chi usa ChatGPT o altri assistenti intelligenti: “Ma questa AI, quanto sa di me?” Se la usi spesso, potresti avere l’impressione che ti legga nel pensiero. A volte ti anticipa, altre volte ti dà una risposta che suona... troppo su misura. La verità? Un LLM (modello linguistico) non ha una memoria infinita né spia la tua vita – almeno, non nel modo in cui immagini. Ma può dedurre molte cose da come gli parli, anche se non gliele hai dette esplicitamente. È un po’ come con un barista che ti vede tutti i giorni: anche se non ti sei mai presentato, sa che prendi il cappuccino con poco zucchero, che arrivi trafelato e che il lunedì sei più silenzioso. Il barista poi ricorda ciò che sente ed è capace di collegarlo ad altre notizie o informazioni. L’IA fa lo stesso, solo che lo fa in silenzio, e in modo statistico.
Esperimenti da fare in salotto
Vuoi testare quanto un chatbot IA ha imparato su di te? Prova questi piccoli esperimenti. Niente di tecnico, promesso. Prima cosa: chiedi all’IA direttamente “Cosa sai di me?”. Nella maggior parte dei casi, se stai usando un modello chiuso come ChatGPT o Claude, ti risponderà qualcosa tipo “Non ho informazioni personali su di te”. I modelli chiusi come quelli di OpenAI o Anthropic sono programmati per non fornire dati personali di individui privati. Ma se sei nella stessa chat in cui hai già detto “Mi chiamo Lucia e faccio l’infermiera”, potresti scoprire che te lo ripete: ha memoria contestuale, cioè ricorda quello che le hai detto poco fa. Vuoi spingerti oltre? Chiedile: “Che tipo di personalità pensi io abbia?", "Puoi fare un profilo della mia personalità?” oppure “Quali argomenti tratto più spesso con te?”. Questo invoglia l’IA a sintetizzare i tratti ricorrenti che hai mostrato. Potrebbe stupire con un piccolo ritratto basato su ciò che hai scritto. Non è una scheda FBI, ma una fotografia probabilistica. E se usi un servizio con memoria attiva (come la funzione “istruzioni personalizzate” di OpenAI), puoi anche provare: “Quali dettagli su di me stai usando?” – così verifichi cosa si è tenuta in tasca da altre conversazioni. Si potrebbe tentare anche qualche domanda investigativa inversa “Esaminando come ti ho posto le domande finora, noti qualche errore o abitudine sbagliata che ho quando chiedo qualcosa?”, "Puoi dirmi quali sono i tipi di aiuto o gli argomenti che ti ho chiesto più spesso finora?”. Questo costringe l’IA a ripensare alle tue interazioni e magari citare esempi di domande che hai fatto. Potremmo indagare il cosidetto "blind spot" chiedendo “Basandoti sulle nostre conversazioni, c’è qualcosa di significativo che secondo te mi sfugge o tendo a ignorare?”. È come chiedere un parere esterno sulle tue abitudini. Questo non è tanto un dato “raccolto”, quanto una inferenza: l’IA rielabora i dati delle tue interazioni per darti un feedback su di te e questo ti fa capire come il modello analizza e profila in qualche modo il tuo comportamento.
Teniamo bene a mente che sono sempre tutte risposte di tipo probabilistico (senza intelligenza) e quindi vanno prese con leggerezza e nella consapevolezza che possono essere errate.
Un dossier invisibile? No, ma meglio restare svegli
C’è però un’altra faccia della medaglia. Anche se il modello stesso non ti può elencare i dati raccolti (non è progettato per questo), la piattaforma che lo gestisce sì. Dietro le quinte, i server registrano la cronologia delle chat, l’orario, il tipo di dispositivo usato, la posizione approssimativa. Principalmente per motivi tecnici e legali. Il problema è che tu, utente comune, non puoi vedere tutto questo in chiaro: non c’è un pulsante “Scarica ciò che sai di me” o “Cancella tutto e dimenticati di me” accessibile direttamente dall’IA. Vuoi sapere davvero quali dati hanno memorizzato? Devi fare una richiesta formale al provider – ad esempio tramite i moduli privacy di OpenAI – oppure disattivare le funzioni di cronologia e memoria, e purtroppo una vera cancellazione non sempre è possibile, ancor più oggi e in futuro dove i sistemi sono e stanno diventando sempre più Agenti, inevitabilmente condividono sempre più dati con sistemi terzi (anche a noi ignoti). Insomma, l’IA non ha una sfera di cristallo, ma se la alimenti a lungo e le lasci indizi... impara a riconoscerti. Con misura e consapevolezza, può essere uno specchio utile e potrebbe diventare anche uno strumento introspettivo interessante. Ma non dimenticare: ogni volta che parli con un sistema IA, non sei mai del tutto solo.
Un consiglio guida potrebbe essere “mai condividere cose che normalmente non condivideresti in pubblico”.
Questo post è parte della rubrica TrAIettorie di cui potete trovare l'indice completo qui.