A metà degli anni Sessanta, nel film 2001: Odissea nello spazio, il computer di bordo HAL parlava con i membri dell’equipaggio come se fosse umano.
Più di mezzo secolo dopo, da fine novembre 2022, possiamo parlare con il computer (grazie a ChatGPT) in modo così fluido che si rischia di immaginarlo come HAL.
Ma è veramente così? E soprattutto corriamo sul serio il rischio che le macchine prendano il sopravvento sull’uomo catapultandoci in un mondo dominato da computer umanizzati?
L’intelligenza artificiale generativa (in inglese Generative AI) è sicuramente l’argomento del momento, che sta interessando sia gli scienziati dell’informazione che i governi di mezzo mondo (vedi il recente scontro tra Parlamento europeo e i ragazzi di OpenAI sulle regole per l’uso di ChatGPT).
Si tratta di una materia complessa e non è certo roba di cui discutere durante la pausa pranzo. Ma semplificando al massimo possiamo dire che quella che sui giornali viene chiamata intelligenza artificiale è in realtà solo una branca della galassia dellIA, e si chiama Apprendimento Automatico (in inglese Machine Learning).
In cosa consiste? Si tratta di addestrare un computer in modo che acquisisca comportamenti e modi che simulano quelli del cervello umano. Insomma, niente di lontanamente paragonabile agli scenari da film fantascientifico in cui macchine ultra-intelligenti sono in grado di distruggere il genere umano. Ma andiamo con ordine.
1. Machine Learning e Deep Learning
La parola intelligenza artificiale (Artificial Intelligence) è stata coniata dallo scienziato americano John McCarthy.
In un suo articolo del 2005, McCarthy scrive che "l'intelligenza artificiale è la scienza e l'ingegneria di fare macchine intelligenti, in particolare programmi informatici intelligenti".
Ma come fanno le macchine a imparare ciò che devono fare e soprattutto a diventare "intelligenti"? Esistono due tecniche di apprendimento: il machine learning e il deep learning.
Il machine learning, che possiamo tradurre come apprendimento automatico, insegna alle macchine attraverso complessi algoritmi e può essere diviso in tre principali sottocategorie: apprendimento supervisionato, non supervisionato e rinforzato.
Nell'apprendimento supervisionato, alla macchina vengono forniti sia degli input (ossia dei dati), sia degli output, ossia alcuni esempi che corrispondano al risultato atteso.
Questo modello è stato adottato per addestrare ChatGPT la tecnologia di intelligenza artificiale (IA) sviluppata da OpenAI. In pratica durante il training di ChatGPT è stato chiesto ai supervisori umani di fornire sia le domande che le risposte desiderate.
In questo modo ChatGPT ha imparato e ha acquisito quella disinvoltura che lo fa apparire quasi umano. Il secondo modello di machine learning è quello dell'apprendimento non supervisionato.
In questo caso vengono messi a disposizione della macchina solo degli input e nessun esempio di risultato. Infine c'è il machine learning rinforzato. In questo caso il computer, come in un videogame, riceve una ricompensa o una penalità in base al fatto che abbia raggiunto o meno l'obiettivo finale.
L'IA impara quindi quale sia la sequenza di azioni che la porta più velocemente all'obiettivo. Il machine learning può diventare ancora più complesso e in questo caso si parla di deep learning.
Con il deep learning si impressionante, soprattutto utilizzano reti neurali artificiali (progettate per riprodurre il comportamento dei neuroni del cervello umano) con molti strati di elaborazione per far apprendere alla macchina quantità di dati sempre più complesse.
2. Dove è usata l'intelligenza artificiale?
Prima che l'intelligenza artificiale diventasse popolare su giornali, quotidiani e televisioni, erano già tantissimi i settori che la utilizzavano.
I primi che vengono in mente sono sicuramente gli assistenti vocali Siri e Alexa, che tramite il riconoscimento vocale possono eseguire una serie di attività al nostro posto.
A questa IA possiamo chiedere di riprodurre canzoni, accendere le luci di casa, fare chiamate o cercare una via.
L'intelligenza artificiale è fondamentale anche nel settore delle vendite, per raccogliere informazioni su tutto il processo di vendita online (pre-vendita, vendita, post-vendita) e orientando così il consumatore verso nuovi acquisti.
Anche i social media e le società di streaming video fanno uso di intelligenza artificiale. Facebook è in grado di rilevare le caratteristiche del viso per taggare gli amici, mentre Netflix grazie a una tecnologia detta predittiva, può suggerirci i film più compatibili con i nostri gusti. Infine, nel settore della cybersecurity e della sicurezza pubblica, l'intelligenza artificiale è utilizzata in molti Paesi del mondo.
Uno degli ambiti della sicurezza pubblica in cui è utilizzata l'intelligenza artificiale è quello del riconoscimento biometrico. Nel caso della sicurezza informatica, l'IA è sfruttata per creare modelli in grado di prevedere potenziali minacce alle infrastrutture IT.
Con questa soluzione i tecnici hanno la possibilità di mettere l'ambiente in sicurezza ed evitare attacchi hacker e conseguenti perdite.
3. I nuovi confini dell'IA
L'intelligenza artificiale generativa, quella del machine learning e del deep learning vista in precedenza, ha subito un'accelerazione violentissima negli ultimi due anni.
Il motivo è presto detto: oggi è possibile avere a disposizione più dati grazie alla potenza di calcolo delle nuove macchine e a migliori algoritmi generativi.
Fino al 2015 per consentire a una macchina di "apprendere" si usavano modelli linguistici non troppo sofisticati, ma efficaci per compiti molto semplici come previsioni di eventi o traduzioni.
Ma nel 2017 arriva la svolta: da una ricerca di Google Research nasce il concetto di rete neurale in grado di generare modelli linguistici di qualità più elevata. Da lì il passo è breve: i big del mondo tech come Microsoft, Google e OpenAI fiutano l'affare.
E così, nel 2020, assistiamo alla prima evoluzione della specie dell'intelligenza artificiale: nasce GPT-3 un modello di IA "umanizzato". L'acronimo sta per Generative Pre-trained Transformer, che in italiano possiamo tradurre come Trasformatore Pre-addestrato Generativo.
Si tratta di un modello di rete neurale che dopo aver appreso è in grado di riprodurre testo e immagini in modo umanizzato. Con l'uscita di GPT-3, nel giro di pochi mesi, si affermano software di IA, inconcepibili fino a qualche tempo prima.
Parliamo di DALL-E 2 generatore di immagini utilizzato da oltre 2 milioni di persone che producono più di 3 milioni di immagini al giorno. I risultati sono così realistici da aver messo in allarme molti governi e istituzioni per la difficoltà, per non dire impossibilità, di distinguere una immagine finta generata dall'IA da una reale.
Sulla falsa riga di Dall-E si è affermato Midjourney, in grado anch'esso di generare immagini e con oltre 4 milioni di utenti. L'utilizzo di entrambi gli strumenti è elementare: basta una breve descrizione testuale di ciò che vogliamo ottenere e l'IA pensa a tutto il resto generando le immagini.
Perché è proprio questa la ragione fondamentale del successo di questi software GPT-3 based: la loro estrema semplicità. Sono software di intelligenza artificiale così intuitivi che anche chi ne è completamente a digiuno può ottenere risultati da urlo.
In questa panoramica sulla rivoluzione dell'IA non possiamo non ricordare ChatGPT, il chatbot di OpenAI, capace non solo di simulare le conversazioni umane, ma in grado anche di correggere codice di programmazione informatico, di spiegare algoritmi complessi usando un linguaggio da film gangster, di comporre musica per pianoforte e raccontare barzellette.
4. Dalle facce alla voce: così le IA conquistano il cinema. Quale futuro ci attende?
La potenza di fuoco dell'IA nel campo del trattamento delle immagini non poteva lasciare indifferenti le grandi major di Hollywood che si sono buttate a capofitto nella sperimentazione.
Possiamo dire che l'uso dell'AI a Hollywood non è futuro, ma è già realtà. Basta citare produzioni come Stranger Things e Mercoledì o film come Spiderman: No Way Home per comprendere come tutti gli studios, da Disney a Warner Bros, passando per Amazon, Apple, HBO, Marvel e Netflix siano"sul pezzo".
Nell'ultimo Indiana Jones ha fatto scalpore la tecnica AI del deaging (potremmo dire lo svecchiamento) che ha permesso di rivedere un giovane Harrison Ford sullo schermo (foto sotto).
Viene utilizzato un database di volti, affinato per le esigenze specifiche, cioè con i dati dell'attore o dell'attrice su cui è necessario "intervenire".
Si sceglie la persona su cui intervenire, si seleziona la parte del volto che interessa e si impostano i parametri per decidere l'entità della modifica, che potrà essere applicata in ogni scena in cui appare quella specifica parte del volto. La velocità di elaborazione dell'intelligenza artificiale è impressionante e i costi sono decisamente bassi, una volta ammortizzato l'investimento iniziale.
Quale futuro ci attende? La rivoluzione lanciata dal modello di rete neurale GPT è ancora in atto ed è quindi difficile definirne i contorni. Secondo gli esperti, tuttavia, è possibile fare qualche ipotesi. La prossima fase di questa rivoluzione sarà quella dell'integrazione di questi metodi di generazione all'interno di prodotti già ampiamente utilizzati dalle persone.
Per essere più chiari, Microsoft ha già annunciato l'integrazione di GPT nel suo motore di ricerca Bing e in Office 365, così come Google li sta testando nella suite Google Workspace. Questo enorme interesse intorno all'IA farà sì che l'intelligenza artificiale generativa si diffonderà rapidamente nelle nostre vite con indiscutibili vantaggi ma anche qualche rischio.
Uno su tutti è legato alla disinformazione: la facilità e rapidità con cui vengono prodotte immagini e testi verosimili (a volte indistinguibili da quelle reali) può portare ad una confusione e inquinamento dell'informazione.
5. Il campo di battaglia dei motori di ricerca
Come abbiamo visto i big del mondo tech stanno investendo cifre impressionanti nello sviluppo ed potenziamento dell'IA.
Secondo gli analisti e esperti del settore, il campo di battaglia dove si fronteggeranno i colossi informatici sarà quello dei motori di ricerca basati sull'intelligenza artificiale.
Al momento il primato se lo contendono due colossi come Microsoft e Google. Una battaglia condotta a colpi di annunci, anticipazioni, acquisizioni e investimenti miliardari. Microsoft ha lanciato una nuova versione di Bing, il suo motore di ricerca integrato con ChatGPT.
Secondo il CEO di Microsoft Satya Nadella: "Questo è l'inizio di una nuova era per i motori di ricerca". Grazie a ChatGPT gli utenti Bing potranno chiedere tutto in modo naturale, dall'elaborazione di un testo, alla creazione di un'immagine fino al menu personalizzato o un percorso di viaggio.
Per rendere l'esperienza più accattivante verrà ridisegnato anche Edge, il browser di Microsoft. La risposta di Google non si è fatta attendere ed ha un nome che è tutto un programma: Bard, il poeta-cantore di imprese e gesta epiche presso i popoli celtici.
Bard si basa su LaMDA acronimo di Language Models for Dialog Applications, un sistema linguistico creato dall'AI.
Anche il nuovo nato di casa Google è un chatbot conversazionale. L'utente potrà parlare con Bard (un po' come avviene con ChatGPT) per chiedere aggiornamenti stradali, meteo e tutte quelle info che normalmente scriviamo nel motore di ricerca.
Ma entrambi i colossi per il momento vanno cauti sui tempi di rilascio. Un conto è infatti restituire all'utente un elenco di collegamenti Internet, un altro simulare una conversazione e fornire informazioni organizzate.
Note
DOTA 2: il videogioco su cui si allenano le IA
Le intelligenze artificiali sono bravissime con i giochi e imparano rapidamente le regole secondo il modello di apprendimento automatico rinforzato (reinforcement machine learning).
Se sbagli perdi. Se vinci passi al livello successivo del gioco. Nel 2017 fece notizia il software di Google, AlphaGo, che riuscì a imparare a giocare a Go (un gioco da tavolo strategico per due giocatori) arrivando a superare gli umani.
Anche OpenAI, che ha ricevuto miliardi di dollari di investimenti da Microsoft per il suo ChatGPT, ha alle spalle una lunga esperienza con i videogiochi. Tra 2016 e 2019, i ragazzi di OpenAI hanno lavorato allo sviluppo di una IA, forse meno conosciuta di ChatGPT, chiamata Five. Questa intelligenza artificiale è stata addestrata giocando al videogame Dota 2.
I numeri sono da capogiro: secondo i dati forniti da OpenAI, l'intelligenza artificiale Five ha disputato diecimila anni di partite contro se stessa, con una media di 180 anni di partite al giorno.
Ovviamente Five è diventata bravissima, al punto che fra 2018 e 2019 ha affrontato giocatori online (vincendoil 99,4% delle volte) ma soprattutto ha partecipato a The International, il campionato mondiale annuale di Dota 2 con montepremi di oltre 20 milioni di dollari, battendo in finale i campioni in carica. Ma a quanto ci risulta non ha ritirato il montepremi.
Fra il 2016 e il 2019, gli ingegneri di OpenAl hanno sviluppato Five, una intelligenza artificiale che imparava... giocando al videogioco Dota 2 (foto sotto).