Le reti neurali rappresentano il cuore pulsante dell'intelligenza artificiale moderna e sono fra le tecniche più popolari e potenti nel campo del machine learning. In questo articolo vediamo che cosa sono esattamente e come funzionano. Per un’introduzione sull'intelligenza artificiale (IA) in generale, abbiamo questo articolo introduttivo!
Cosa sono le reti neurali?
Un cervello artificiale
L'idea rivoluzionaria alla base delle reti neurali trae ispirazione dal cervello umano. Miliardi di neuroni interconnessi che si scambiano segnali: ecco il modello che gli scienziati hanno replicato digitalmente. Nelle reti neurali, i neuroni sono costituiti da unità di calcolo semplici, connesse tra di loro. Il grande numero di collegamenti permette alla rete neurale nel suo insieme di svolgere compiti molto complessi. In generale, più è complesso il compito e più neuroni sono necessari.
È importante notare che, a differenza del cervello umano, i collegamenti tra i neuroni in una rete neurale artificiale non sono fisici, come cavi o fili. Si tratta di connessioni puramente matematiche e virtuali, rappresentate da numeri memorizzati in un computer. Per le reti neurali open source, come Llama di Meta, è addirittura possibile scaricare questi numeri da Internet!

Il cervello umano impara a svolgere attività elaborando moltissime informazioni percepite con i cinque sensi. Per esempio, dopo aver osservato le espressioni di molte persone (vista) e ascoltato le loro parole (udito), siamo in grado di capire quali emozioni stanno provando.
In modo analogo, le reti neurali imparano a svolgere compiti complessi utilizzando grandi quantità di dati forniti dagli sviluppatori. Per esempio, si potrebbero fornire a una rete neurale 10.000 immagini di facce a ciascuna delle quali una persona ha associato un’emozione; dopo una fase di allenamento, anche la rete neurale sarà in grado di riconoscere le espressioni umane.

Il segreto del successo: big data e supercomputer
Nate da un'idea risalente agli anni ‘40, le reti neurali stanno sconvolgendo il mondo solo di recente. Il motivo? La convergenza di due fattori chiave:
- computer molto più potenti per eseguire i calcoli necessari;
- accesso a enormi quantità di dati (i famosi “big data”) per addestrare le reti.
È come se finalmente si fosse fornito al cervello digitale il "cibo" (i dati) e i "muscoli" (la potenza di calcolo) necessari per esprimere appieno le sue capacità.
Come funzionano le reti neurali?
I neuroni: lampadine digitali
I neuroni di una rete neurale possono essere pensati come lampadine con la luminosità regolabile, che possono essere accese, spente o una via di mezzo. Un neurone “più acceso” è rappresentato nel computer da un numero più grande, un neurone “più spento” è rappresentato da un numero più piccolo.
I neuroni sono organizzati in strati, che possono essere di tre tipi principali.
- Strato di input: riceve le informazioni dall'esterno, come i nostri sensi. Per esempio, in una rete che riconosce immagini, questo strato potrebbe ricevere numeri che rappresentano i colori dei pixel di un'immagine.
- Strato di output: dà il risultato finale. Potrebbe essere una classificazione ("Questa è una foto di un gatto"), un valore numerico (previsione del prezzo di una casa), o altro ancora.
- Strati nascosti: tutti gli strati tra quello di input e quello di output. Procedendo dall’input verso l’output, ogni strato elabora le informazioni in modo sempre più astratto. In un sistema di riconoscimento immagini, i primi strati potrebbero rilevare linee e forme semplici, mentre gli strati più profondi potrebbero riconoscere caratteristiche più complesse come occhi, nasi, o intere facce.

Il flusso dell'informazione: un viaggio tra i neuroni
Ogni neurone è connesso con i neuroni dello strato precedente e di quello successivo. Ogni connessione ha un "peso", che determina quanto forte è quel collegamento. Inoltre, ogni neurone ha un "bias", che influenza quanto facilmente si attiva.
Le informazioni si propagano strato per strato, dall’input verso l’output, nel modo seguente.
- Un neurone riceve, dai neuroni dello strato precedente, quei numeri che corrispondono al loro stato (acceso o spento).
- Il neurone elabora le informazioni sommando i numeri corrispondenti a ogni neurone dello strato precedente, ciascuno moltiplicato per il peso della corrispondente connessione.
- Alla somma appena calcolata si aggiunge il bias: questo completa la determinazione di quanto il neurone corrente sia acceso o spento.
- Se il risultato è un numero positivo, il neurone lo trasmette tale e quale ai neuroni dello strato successivo (neurone acceso); se il risultato è un numero negativo, viene trasmesso 0 allo strato successivo (neurone spento).

L’addestramento: la rete neurale va a scuola
Ma come fa una rete neurale a essere “intelligente”, cioè a svolgere compiti complessi con successo? Bisogna addestrarla con una grande quantità di dati.
Per esempio, se si vuole che una rete neurale impari a riconoscere gatti nelle foto, bisogna mostrarle tante foto diverse, ognuna delle quali accompagnata da un’etichetta “gatto” o “non gatto”. Queste etichette devono essere create in precedenza da delle persone, in modo da fornire alla rete neurale una base da cui imparare (un po’ come un bambino che impara i nomi degli oggetti dai suoi genitori). Elaborando le foto, la rete neurale aggiusta i suoi pesi e bias in modo da riflettere la classificazione (“gatto” o “non gatto”) il più precisamente possibile. Ecco come funziona questo processo nel dettaglio.

- All’inizio, i pesi e i bias sono casuali. La rete non sa nulla sui gatti e le sue classificazioni sono casuali.
- Si mostrano alla rete tantissime foto. Per ogni foto, la rete fa una classificazione (“gatto” o “non gatto”).
- La rete confronta le classificazioni prodotte con le etichette fornite dagli umani, e calcola l’errore che ha commesso.
- La rete calcola quanto ogni peso e bias ha contribuito all'errore, e li modifica leggermente per ridurre l’errore.
- I passaggi dal 2 al 4 vengono ripetuti. Dopo molte iterazioni, l’errore si sarà ridotto al minimo e la rete sarà in grado di identificare i gatti nelle foto.
Deep Learning: quando l'intelligenza artificiale diventa profonda
Il "deep learning" usa reti neurali con molti strati nascosti, e quindi moltissimi neuroni. Il grande numero di neuroni e strati permette a queste reti neurali di modellizzare fenomeni molto più complessi e caratteristiche molto più sofisticate rispetto alle reti più piccole, in modo ancora più simile al cervello umano. È proprio questa capacità di gestire la complessità che ha portato a enormi progressi dell’IA negli ultimi anni. Il deep learning è attualmente alla base dei più potenti modelli in campi come:
- visione artificiale (riconoscimento di oggetti e volti in immagini);
- elaborazione del linguaggio naturale (traduzione automatica, assistenti vocali);
- generazione di contenuti (testo, immagini, musica).
Per approfondire le differenze tra deep learning, machine learning e IA puoi leggere questo articolo.
Le reti neurali intorno a noi
Le applicazioni nella nostra vita quotidiana
Le reti neurali sono ormai onnipresenti nella nostra vita quotidiana:
- Riconoscimento immagini: quando Facebook suggerisce i tag nelle foto, sta usando reti neurali per riconoscere i volti.
- Traduzione automatica: Google Translate utilizza reti neurali avanzate per tradurre tra le lingue.
- Sistemi di raccomandazione: Netflix e Amazon usano reti neurali per suggerirti prodotti o contenuti che potrebbero piacerti.
- Guida autonoma: le auto a guida autonoma, come la Tesla Modello 3, utilizzano reti neurali per interpretare l'ambiente circostante.
- Diagnosi mediche: alcune reti neurali possono analizzare immagini mediche e aiutare nella diagnosi di malattie.
Luci e ombre di una tecnologia rivoluzionaria
Negli ultimi anni, le reti neurali si sono rivelate strumenti molto utili per svolgere compiti estremamente complessi e aiutare noi esseri umani a compiere moltissimi lavori diversi. Tuttavia, presentano alcune problematiche, tra cui:
- necessità di una grande potenza di calcolo (impatto economico/ambientale);
- è molto difficile capire per quale motivo una rete neurale prende una decisione piuttosto che un’altra (interpretabilità/spiegabilità);
- possibilità di perpetuare o amplificare pregiudizi presenti nei dati di addestramento;
- privacy dei dati usati per l'addestramento;
- impatto sull'occupazione con l'automazione di sempre più compiti.
In conclusione: il futuro è già quiRicapitoliamo: le reti neurali artificiali, ispirate al cervello umano, utilizzano unità di calcolo semplici (neuroni) organizzate in strati per elaborare informazioni e risolvere problemi complessi. Funzionano grazie a computer potenti e grandi quantità di dati. I neuroni, connessi tra loro da pesi e bias, trasmettono e trasformano le informazioni. L'addestramento avviene tramite la regolazione di questi pesi e bias usando molti esempi. Il deep learning, che utilizza reti neurali con molti strati nascosti, ha rivoluzionato campi come la visione artificiale e l'elaborazione del linguaggio. Per saperne di più sulle attuali sfide nell'addestramento delle reti neurali, puoi leggere il nostro prossimo articolo.

Martina Pepiciello
Martina Pepiciello è una collaboratrice di AgorAI. Scrive news e articoli di approfondimento in tema di IA.