AS_08_2018

Definita la tassonomia, un motore di categoriz- zazione automatica può essere creato in modo da poter assegnare una o più categorie ad un mede- simo requisito. ‘Scrivere’ regole significa defi- nire una condizione linguistica che deve essere soddisfatta: IF “condizione linguistica” THEN “categoria applicata al requisito” Per esempio: SCOPE SENTENCE {{DOMAIN (2.1:NORMAL) {LEMMA(“terrorist”) > SYNCON (70761)// #70761: attack, assault, assail, attempt}}} Tale metodologia necessita di pochi esempi per la definizione di una categoria base (e.g. 10 esempi per una categoria); richiede, invece, tempo per la definizione della tassonomia e delle regole per la categorizzazione automatica. Deep Learning L’apprendimento profondo è definito come una classe di algoritmi che, usufruendo di reti neurali multi-strato, risulta in grado di processare il lin- guaggio naturale e dotato della capacità dell’auto- apprendimento. In generale il Deep Learning può essere di due tipo- logie: Unsupervised learning ; Supervised learning . Il primo è in grado di apprendere senza supervisione di un teacher , è adatto all’analisi e alla scoperta di pattern che non siano ovvii per la mente umana. Il Supervised Learning , invece, impara con l’aiuto iniziale di un teacher ed è adatto alla classificazione. Tale metodo è stato usato per la classificazione dei requisiti e l’intero processo si basa su uno step di ‘insegnamento’, durante il quale si sottopongono al sistema esempi di requi- siti che appartengono e che non appartengo a una determinata categoria, e di un successivo step di test per validarne i risultati: Per questa tipologia di approccio non è richie- sta la definizione di tassonomie a-priori, il sistema necessità però di un numero cospi- cuo di esempi per una categoria base (>1.000 dati storici), i tempi di apprendimento sono ridotti; ha però lo svantaggio di non poter essere a conoscenza delle regole che si auto- generano all’interno della rete neurale (con- trariamente a quanto accade per il metodo Rule-based ). Conclusioni Le due differenti metodologie sono validate mediante i medesimi k-factors (i.e. recall , pre- cision ) che vanno a identificarne il livello di affidabilità (0-100%) mediante le seguenti cor- relazioni: F-Measure: 2 x (Precision x Recall) / (Precision + Recall) Dove: - Recall: (true positive)/(true positive + false negative), - Precision: (true positive)/(true positive + false positive). Gli output , basati su esempi veri positivi, falsi positivi e falsi negativi, sono calcolati automa- ticamente dal sistema e restituiscono un valore percentuale dell’ F-measure (0-100%). In generale, un output risulta affidabile se pre- senta un F-measure>95% ; anche se, ovviamente, è sempre l’uomo a validarlo o meno in base al campo di applicazione. Come inviare dei contributi a ‘Esperienze e Idee’ La rubrica di condivisione di ‘Esperienze e Idee’, curata da Fausto Gorla, è aperta ai contributi dei lettori di Automazione e Strumenta- zione sui temi più vari, scelti dalla redazione. Gli interessati inviino i loro lavori a: idee@anipla.it , allegando un testo di almeno 2.000 caratteri, completo di un’immagine, e specificando un’indicazione di titolo, sottotitolo e didascalia. Method II: Supervised Learning Type Automazione e Strumentazione Novembre/Dicembre 2018 ESPERIENZE&IDEE tecnica 89