AO_427

GENNAIO-FEBBRAIO 2021 AUTOMAZIONE OGGI 427 91 oggetti. La classificazione consiste nell’attribuire a una data im- magine l’appartenenza a una classe di oggetti, ad esempio ‘pa- esaggi’, ‘persone’, ‘gatti’, ‘automobili’ e così via. È una funzione utilizzata quotidianamente dai motori di ricerca per classificare le immagini. Il rilevamento di oggetti consiste nel riconoscere e isolare, tipicamente per mezzo di una cornice etichettata, un de- terminato tipo di oggetti, come un’automobile, un pedone, una faccia, parti specifiche del corpo o determinati strumenti o pezzi meccanici. Un’altra operazione è poi quella dell’identificazione che permette di stabilire se una data immagine corrisponde a un modello di riferimento. L’identificazione facciale a scopo biometrico o di videosorveglianza è una delle applicazioni più diffuse della moderna visione artificiale. La segmentazione è l’operazione fondamentale che sta alla base degli algoritmi di rilevamento e classificazione e la sua imple- mentazione con i metodi della tradizionale elaborazione delle immagini è sì possibile, ma in molti casi limitata o inefficiente. Il ricorso a tecniche basate sull’intelligenza artificiale simbolica e ancor di più sul Deep Learning ha reso possibile implementare algoritmi di segmentazione completa, ove la partizione dei pixel dell’immagine è totale, con ogni regione associata (con alta pro- babilità di successo) a oggetti del mondo reale. L’operazione di segmentazione può inoltre essere semantica o d’istanza: nel primo caso tutti gli oggetti appartenenti a una determinata ca- tegoria sono associati allo stesso segmento (automobili, pedoni, ciclisti...) mentre nel secondo ogni oggetto viene trattato come un elemento separato, ancorché appartenente alla medesima categoria rendendo possibile un rilevamento granulare di tutti gli attori sulla scena. L’elaborazione classica delle immagini Non tutti gli algoritmi di visione artificiale richiedono l’intelli- genza artificiale: sono numerose, infatti, le tecniche di elabora- zione delle immagini della vecchia scuola che fanno capolino nei moderni sistemi. Da un lato come procedure accessorie per la preparazione dei dati da passare ai sistemi di machine lear- ning, dall’altro come tecniche pensate per contesti specifici, o addirittura come robusti algoritmi generali dotati di adeguate caratteristiche di efficienza e accuratezza. Tra le tecniche di seg- mentazione tradizionali, basate su algoritmi rigidi che richie- dono sovente l’intervento di un operatore umano per essere portati a termine, figurano le tecniche di sogliatura (threshol- ding), quelle di rilevamento di contorni, l’algoritmo di clustering K-means e le tecniche basate sugli istogrammi. Si tratta di pro- cedure tipicamente applicate a immagini ad alto contrasto, con sfondo uniforme e oggetti di forma nota a priori come quelle che compaiono nella conta dei globuli rossi, nel riconoscimento di caratteri stampati e nell’assemblaggio o controllo di qualità di pezzi di forma geometrica semplice. Una delle prime tecniche di riconoscimento di successo è stato l’algoritmo di riconoscimento delle impronte digitali impiegato dall’FBI che utilizza una trasformata wavelet per comprimere le immagini e confronta le impronte cercando un insieme di punti dotati di caratteristiche geometriche distintive. Più in generale, il riconoscimento e il rilevamento di oggetti pongono delle sfide non indifferenti alle tecniche tradizionali di confronto con modelli di riferimento per via delle variazioni di orientamento, scala e illuminazione che si riscontrano nel mondo reale. Ad avere più successo sono state le tecniche di identificazione ed estrazione delle caratteristiche che, unite ad algoritmi statistici per la classificazione, hanno prodotto robusti algoritmi di riconoscimento degli oggetti. Uno dei più famosi è l’operatore SIFT (Scale Invariant Feature Transform) pubblicato nel 1999, che trasforma l’immagine in un insieme di caratteristiche distintive che non risentono degli ef- fetti di traslazione, rotazione, scala o trasformazione affine. Questo algoritmo è a tutt’oggi impiegato in applicazioni di rico- noscimento di oggetti e gesti, tracking e sovrapposizione dina- mica di immagini, navigazione robotica e creazione di modelli tridimensionali. Un’altra tecnica ampiamente diffusa prima dell’avvento del machine learning è nota con l’acronimo HOG (Histogram of Oriented Gradients) e si base sull’istogramma del gradiente di- rezionale per estrarre le caratteristiche del corpo umano in ma- niera indipendente dall’illuminazione. Symbolic AI e Machine Learning L’intelligenza artificiale ha portato nuova linfa nel mondo della visione computerizzata, introducendo una pletora di nuovi metodi di classificazione, riconoscimento e rilevamento di im- magini ancora prima dell’avvento delle reti neurali e del deep learning. In particolare, in seno a quella che si può definire in- Nella segmentazione semantica di un’immagine i vari detta- gli della stessa sono separati e correttamente attribuiti alle etichette ‘apprese’ durante la fase di apprendimento (Fonte: Missing Link AI) L’algoritmo SIFT (Scale Invariant Feature Transform), tuttora usato con successo, è stato uno dei primi approcci all’estrazione di feature da un’immagine a risultare insensibile alla posizione, rotazione, dimensione e deformazione dei particolari (Fonte: pythonhosted.org)

RkJQdWJsaXNoZXIy MTg0NzE=