Deep learning

atlante – nuove tecnologie

Il deep machine learning, o più brevemente deep learning, è il futuro dell’intelligenza artificiale usata nelle macchine che affrontano problemi tipici dell’intelligenza umana, come pianificare, comprendere linguaggi verbali, riconoscere immagini e suoni, apprendere, definire e risolvere problemi. Il deep learning scende in profondità per emulare i meccanismi di apprendimento degli umani, automatizzando analisi e previsioni.

Il machine learning, di cui fa parte il deep learning, si serve delle reti neurali per analizzare grandi quantità di dati, semplificarli, apprendere dalle decisioni sbagliate, che riconosce e corregge man mano che lavora, tratta sempre più dati, acquisisce più esempi ed esamina più casi. Il deep learning, formato da un insieme di hardware e software, addestra automaticamente le reti neurali e le rende capaci di imparare a gestire gli input, a costruire modelli via via più complessi, a fare previsioni sempre più accurate, e infine a risolvere problemi con maggiore efficienza.

Nel deep learning le elaborazioni avvengono lungo diversi livelli nascosti
Nel deep learning le elaborazioni avvengono lungo diversi livelli nascosti

Una rete neurale analizza le informazioni che riceve, le aggrega in pacchetti, ne estrae le proprietà che le permettono di apprendere, e che finora erano selezionate e proposte come modelli da interventi umani. Il deep learning rimuove l’intervento umano e rende le reti neurali più generaliste e meno mirate, e quindi più capaci di adattarsi a problemi nuovi.

L’apprendimento strutturato profondo, o apprendimento gerarchico, usa algoritmi di assimilazione e rappresentazione dei dati, invece degli algoritmi che eseguono compiti assegnati. La capacità di pensare e apprendere aumenta con la quantità crescente di dati e algoritmi che si accumula nel tempo, e le reti neurali diventano sempre più abili nell’autoaddestrarsi e apprendere in modo indipendente.

Con il termine profondo (deep) si intende una struttura di apprendimento a più livelli, dalle informazioni brute e particolari fino ai concetti più alti e generali. I livelli intermedi sono nascosti, e possono essere anche più di cento. I nodi delle reti neurali sono disposti su diversi livelli di profondità, in cui i neuroni dei livelli inferiori contribuiscono alla formazione di nuove rappresentazioni di dati più precise e complesse nei livelli superiori. Gli output dei livelli intermedi sono ignoti, e servono solo come input per i livelli superiori, fino ad arrivare agli output finali, che costituiscono i risultati del processo di problem solving richiesto alla macchina.

La struttura è piramidale, perché da una larga base di dati si restringe fino ad arrivare a poche risposte. L’elaborazione non è lineare, ma si articola a cascata lungo gli strati i cui output fanno da input agli strati successivi, classifica dati in entrata e in uscita, estrae quelli che servono e scarta gli altri, li miscela e li trasforma, apprende e perfeziona funzionalità sempre più complesse.

Il percorso verso destra mostra come la macchina scende nel dettaglio e nella complessità, verso sinistra come risale ai concetti generali e semplifica.
Il percorso verso destra mostra come la macchina scende nel dettaglio e nella complessità, verso sinistra come risale ai concetti generali e semplifica.

Per esempio, nel riconoscimento visivo dei pattern,  i neuroni del primo strato possono imparare a riconoscere i bordi, i neuroni nel secondo strato possono imparare a riconoscere forme forti come triangoli o rettangoli, e gli strati successivi possono riconoscere forme sempre più articolate e complesse, fino alle forme frattali e fluide. Ad ogni livello intermedio si aggiungono informazioni e analisi utili a fornire un output affidabile. Più sono i livelli di astrazione, più aumenta la capacità di apprendimento della macchina, che non viene più programmata a svolgere compiti, ma addestrata ad apprendere e risolvere problemi.

Il deep learning impara con l’enorme mole di dati fornita dai sensori dell’IoT (internet of things), che a loro volta sono controllati da dispositivi di intelligenza artificiale, in un circolo virtuoso che sta cambiando il nostro mondo, per rendere più semplice e intuitiva l’interazione umana con la realtà che lo circonda.

Il deep learning serve a riconoscere immagini e suoni, e quindi alla guida automatica di veicoli, alla diagnostica medica, al controllo di qualità nelle catene di montaggio, all’analisi dei flussi comunicativi dei social network, al riconoscimento delle lingue parlate e delle voci, alla microbioinformatica.