Terza dimensione: l’ultima frontiera della visione artificiale.

Dalla rivista:
Automazione Oggi

 
Pubblicato il 16 luglio 2002

Altri tipi di controllo tridimensionale vedono l’utilizzo della risonanza magnetica o degli ultrasuoni impiegati nel caso di getti o saldature. Questi ultimi esempi mettono in risalto come con visione artificiale non s’intenda esclusivamente una visione di tipo ottico, ma, genericamente, un’acquisizione su una qualunque gamma dello spettro. Il problema principale nei controlli dimensionali è l’esigenza di precisioni elevate che evidenziano le attuali limitazioni dei sensori disponibili sul mercato. Per valutare la precisione di un sistema di visione tridimensionale e di un algoritmo, che può essere espressa in mm3/pixel, bisogna tenere conto che lo spessore dei contorni non è unitario, e, supponendo che sia ad esempio di 3 o 4 pixel, si riduce proporzionalmente la risoluzione effettiva. La ricerca del contorno può essere migliorata, in questo caso, con un’operazione di ‘thinning’. Il metodo più semplice consiste nell’aumentare la risoluzione dei sensori, che comporta costi maggiori e presenta le limitazioni delle attuali tecnologie di produzione del silicio. E’ possibile aumentare virtualmente la risoluzione spaziale riducendo l’area inquadrata, ad esempio osservando il campo con più telecamere, oppure aumentando l’ingrandimento in modo che l’oggetto osservato riempia tutta l’immagine. E’ possibile inoltre eseguire interpolazioni sui dati disponibili facendo riferimento a primitive geometriche note, quali archi di cerchio, intersezioni tra segmenti. In tal modo è possibile raggiungere risoluzioni subpixel. Un aspetto interessante delle applicazioni di visione tridimensionale è che sono ‘scalabili’, quindi uno stesso algoritmo applicato con risoluzione dell’ordine del metro può essere applicato a risoluzioni dell’ordine del millimetro o del micron e ciò non vale solo per la metrologia, ma anche per la localizzazione e il tracking.

Il colore nella visione tridimensionale

L’impiego di immagini a colori è relativamente recente per la disponibilità e i costi delle telecamere e soprattutto per l’esigenza di maggiore potenza di calcolo dovuta all’elaborazione di tre immagini in luogo di una perché, come è noto, per la legge della composizione dei colori sono necessarie tre bande. Le immagini digitali a colori possono essere ottenute con telecamere basate sulle seguenti tecnologie: con singolo sensore matriciale CCD (dispositivo ad accoppiamento di carica, Charge Coupled Device) in cui sono presenti alternativamente elementi drogati sensibili alle diverse radiazioni luminose o con tre CCD e un prisma per la scomposizione ottica. Il colore non ha dirette implicazioni per la ricostruzione tridimensionale, ma può portare vantaggi per la segmentazione e il riconoscimento.

Algoritmi di visione tridimensionale

L’algoritmo di un sistema di visione rappresenta a tutti gli effetti il suo motore, il cuore del sistema stesso. Questo nel corso degli anni è cambiato, si è evoluto a tal punto che oggigiorno gli algoritmi sono basati in misura crescente, non più esclusivamente sulla logica tradizionale, cioè su sistemi del tipo IF-Then-Else con albero delle decisioni, ma anche su logica sfumata (fuzzy) o su sistemi di classificazione di tipo neurale (o neuronale), su sistemi esperti (knowledge-based) o su altre tecniche che fanno parte della cosiddetta AI (Intelligenza Artificiale, Artificial Intelligence). Fissati i sistemi di riferimento solidali ai piani di proiezione e al volume in esame, le corrispondenze possono essere descritte attraverso modelli, di diversa complessità, che tengono conto dei dispositivi usati per l’acquisizione delle immagini. Il problema della visione tridimensionale può essere risolto in vari modi che propongono algoritmi diversi o che introducono nel modello ipotesi diverse. Un algoritmo è costituito da più fasi: alla fase di ricostruzione 3D, seguono le eventuali fasi di localizzazione, riconoscimento, misura. Per semplificare la scrittura di un algoritmo è spesso fatta un’ipotesi che può essere introdotta nel modello di visione tridimensionale e che è definita come la ‘prospettiva debole’. Questa consiste nell’assumere costante la distanza degli oggetti dalla telecamera, al fine di rendere il problema lineare. L’illuminazione strutturata cioè la proiezione di profili o motivi (pattern) luminosi noti e periodici, ad esempio griglie o lame di luce in movimento, ha un ruolo fondamentale nella visione 3D, perché consente di ricostruire anche superfici irregolari, fatta eccezione naturalmente, per le parti non illuminate o comunque non visibili. Le tecniche di elaborazione del pattern sono di vario tipo: basati sull’effetto Moiré, basati sullo ‘shift’ di fase o quelle tramite demodulazione diretta del pattern o, in ultimo, quelle che fanno uso della trasformata di Fourier.