AO_427

GENNAIO-FEBBRAIO 2021 AUTOMAZIONE OGGI 427 93 una struttura tridimensionale in cui i neuroni di uno strato sono connessi solo a una piccola regione dello strato precedente e alterna operazioni di convoluzione a operazioni di sottocampio- namento o pooling, che riducono il numero di informazioni da passare al successivo strato convoluzionale. Convoluzione, attivazione per mezzo di una funzione di attiva- zione lineare a tratti (ReLU) e pooling sono ripetuti una moltepli- cità di volte al fine di estrarre informazioni a livelli di astrazione differenti. La CNN è completata da alcuni strati finali di rete neurale completamente connessa per effettuare l’operazione di classificazione sulla base delle informazioni così distillate. Una delle prime CNN ad avere applicazioni pratiche è stata messa a punto nel 1989 ai laboratori AT&T da Yann Lecun: la rete LeNet è una CNN con retropropagazione addestrata a rico- noscere numeri manoscritti che è stata impiegata con successo dall’Ufficio Postale americano per riconoscere i codici postali scritti a mano sulle buste. I progressi delle reti neurali nella visione artificiale sono stati enormemente agevolati dalla disponibilità di dataset estensivi con i quali addestrare gli algoritmi di segmentazione, riconosci- mento e classificazione. Nel 2009, Fei Fei Li dello Stanford Vision Lab rese pubblico un database di oltre 14 milioni di immagini annotate che è stato usato da ricercatori di tutto il mondo per affinare i propri algoritmi e prendere parte a una competizione per testarne l’accuratezza di previsione. Nel 2012, la rete profonda convoluzionale AlexNet, messa a punto da un gruppo di ricercatori guidati da Alex Krizhevsky, ha raggiunto un’accuratezza dell’83,6% e ha rappresentato un momento spartiacque nel mondo del Deep Learning applicato alla visione. AlexNet è composta da cinque strati di convoluzione e pooling, due strati di MLP completamente connessi e uno strato di uscita. L’ingresso è rappresentato dai punti dell’immagine in forma di 224x224 pixel e i cinque strati convoluzionali contengono in successione i contorni e le aree piene, le caratteristiche della texture, la forma degli oggetti e, nell’ultimo strato diverse pose a seconda dell’oggetto. In un certo senso, la rete neurale pro- cede per astrazioni successive in modo gerarchico, isolando prima i contorni, poi le parti e infine l’intero oggetto. Solo tre anni dopo AlexNet, nel 2015, l’accuratezza massima rag- giunta nella competizione ImageNet è stata del 96,4%, segno che gli algoritmi di Deep Learning per compiti di classificazione hanno oramai raggiunto la completa maturità. Le reti neurali convoluzionali (CNN, Convolutional Neural Networks) sono reti neurali profonde in cui il Deep Learning viene implementato per mezzo di strati nascosti di neuroni che effettuano operazioni di convoluzione e pooling, prima di presentare i risultati alla rete decisionale in uscita (Fonte: Sumit Saha, Towards Data Science) Nei veicoli a guida autonoma sono impiegate una molte- plicità di tecniche di visione e intelligenza artificiale che comprendono riconoscimento di pattern, interpretazione della scena e ricostruzione tridimensionale con stima delle distanze (Fonte: Intellias)

RkJQdWJsaXNoZXIy MTg0NzE=