AO_438

Tutorial AUTOMAZIONE OGGI 144 | MAGGIO 2022 AUTOMAZIONE OGGI 438 ricompensa (reward) rappresenta l’incentivo, o ‘rinforzo’, a perseguire comportamenti con maggiori probabilità di successo. Spazi astratti per ML Possiamo definire machine learning lo studio di sistemi e algoritmi che, con l’esperienza, migliorano le proprie prestazioni o la propria conoscenza. Tre concetti costituiscono la base di questi sistemi intelligenti: gli attributi (o feature), i compiti (task) e i modelli. Per poter operare sui dati del problema, l’algoritmo deve essere in grado di interpretarli. Il primo passo consiste nel ‘tradurre’ le informazioni del mondo reale in dati elaborabili: le feature sono corrispondenze tra lo spazio degli ele- menti (istanze) che sono parte del problema da risolvere, e un nuovo spazio (dominio) ge- stibile dall’algoritmo. Il nuovo dominio può contenere numeri interi, reali, variabili boole- ane o categorie discrete. Ad esempio, un ru- dimentale sistema di identificazione facciale potrebbe estrarre dagli elementi X rappresen- tati da foto segnaletiche, una serie di parametri numerici (distanza tra gli occhi, distanza naso bocca, ...) e categorici (colore degli occhi, della pelle, dei capelli) che in un opportuno spazio multidimensionale riassumono le caratteristi- che di una particolare fotografia. Il compito o modello è in sostanza il problema da risolvere: classificazione e regressione sono due esempi nell’ambito del supervised learning; cluste- ring e riduzione di dimensionalità sono invece task tipici dell’unsupervised learning. Sebbene nelle applicazioni reali il numero di dimensioni dello spazio delle feature sia troppo elevato per poter essere visualizzato fedelmente, la sua rappresentazione in uno spazio ridotto bi o tridimensionale rende possibile apprezzare l’a- zione degli algoritmi in maniera intuitiva sotto forma di partizione in regioni decisionali di- sgiunte o approssimazione dei dati per mezzo di una curva o una superficie. Il modello è una corrispondenza tra i punti nello spazio degli oggetti (o delle relative fea- ture) e lo spazio dei risultati, ad esempio tra la collezione di foto segnaletiche e una variabile booleana che rappresenta il risultato del con- fronto con una foto di riferimento. Il modello è il prodotto della fase di addestramento sui dati del training set; l’obiettivo del programmatore è fare in modo che il modello operi con un margine di errore minimo su elementi che non sono stati usati in training (i dati di validazione, prima, e le informazioni nel mondo reale, poi). Nello spazio delle feature, gli algoritmi di raggruppamento si distinguono per il modo in cui creano confini decisionali tra le regioni in cui ricadono gli elementi che si vogliono distinguere Regressione e classificazione rappresentano le due principali categorie di algoritmi impiegati nell’unsupervised machine learning. A seguito delle fasi di training e validazione, i modelli possono essere impiegati per effettuare previsioni