69661 - IMAGE PROCESSING AND COMPUTER VISION M

Scheda insegnamento

Anno Accademico 2018/2019

Conoscenze e abilità da conseguire

Introducing basic knowledge about algorithms, tools and systems for the management, processing and analysis of digital images. The main topics of the course are filtering aspects of digital images, algorithms for image processing, algorithms for segmentation and classification of objects in digital images. Theoretical aspects that are introduced in the course are then applied to the design and manufacturing capabilities of simple systems oriented to real world applications. At the end of the course students are able to master basic digital image processing techniques and know potentials of this technology in applicative research and industrial contexts.

Programma/Contenuti

  1. Introduzione  – Definizioni di base inerenti l'elaborazione di immagini e la computer vision. Panoramica sui principali scenari applicativi.
  2. Formazione ed Acquisizione dell'Immagine -  Modello geometrico della formazione dell'immagine. Camera pinhole e proiezione prospettica. Ricostruzione 3D mediante visione stereo. Impiego di lenti. Campo visivo e profondità di campo. Coordinate proiettive e PPM (Perspective Projection Matrix). Calibrazione della telecamera: parametri intrinseci, estrinseci e distorsioni ottiche. Calibrazione mediante target planari e stima dell'omografia (algoritmo di Zhang). Rettificazione e calibrazione stereo. Concetti di base inerenti sensing, campionamento e quantizzazione dell'immagine. 
  3. Trasformazioni dell'Intensità -  Istogramma. Incremento lineare e non-lineare del contrasto. Equalizzazione e matching dell'istogramma. 
  4. Filtraggio di immagini – Operatori lineari invarianti per traslazione e convoluzione. Trasformata di Fourier per segnali 2D. Media e filtro Gaussiano. Filtro di Sharpening. Filtro Mediano. Filtro Bilaterale. Non-local means..
  5. Segmentazione dell'Immagine – Binarizzazione mediante soglia globale. Determinazione automatica della soglia. Sogliatura adattativa. Region growing. Segmentazione basata sul colore. 
  6. Segmentazione mediante stima del movimento – Differenze fra frames successivi e confronto con il background. Inizializzazione ed aggiornamento del background, Robustezza alle variazioni di illuminazione. 
  7. Morfologia Binaria – Dilatazione ed erosione. Apertura e chiusura. Trasformata Hit-and-Miss. Thinning. 
  8. Analisi delle Componenti Connesse – Distanze sul piano immagine e connettività  Labeling delle componenti connesse. Descrittori di base: area, perimetro, compattezza, circolarità, numero di Eulero. Orientamento e rettangolo che racchiude l'oggetto. Fattore di forma e relativi descrittori. Momenti dell'immagine e momenti invarianti. 
  9. Estrazione dei contorni -  Gradiente dell'immagine. Derivate “smooth”: Prewitt, Sobel, Frei-Chen. Determinazione degli estremanti del gradient. Laplaciano della Gaussiana. Operatore di Canny, 
  10. Features locali invarianti – Il paradigma “detector/descriptor”. Harris Corners. Features invarianti rispetto a variazioni di scale.  SIFT features. Matching efficiente mediante kd-trees.
  11. Individuazione di oggetti – Pattern matching mediante SSD, SAD, NCC and ZNCC. Pattern matching veloce. Shape-based mathing. Trasformata di Hough per forme analitiche. Trasformata di Hough generalizzata.  Individazione di oggetti mediante features locali invarianti: Hough-based voting, stima ai minimi quadrati della similarità. 
  12. Computer Vision 3D – Tecnologie: visione stereo, , laser-scanning, TOF.  Immagini RGB-D (e.g. sensore Kinect ). Algoritmi di matching stereo: approcci locali, semi-globale e globali. Elementi di base inerenti l'elaborazione e l'analisi di nuvole di punti.

Il corso prevede inoltre esercitazioni di laboratorio assistite basate sulla libreria OpenCV ed incentrate su alcuni degli argomenti teorici trattati (quali trasformazioni dell'intensità, filtraggio di immagini, calibrazione della telecamera e stima del movimento). 

Testi/Bibliografia

  • Gonzales R., Woods R. : “Digital Image Processing”, Third Edition, Pearson Prentice-Hall, 2002.
  • D.A. Forsyth, J. Ponce:  “Computer Vision   A Modern Approach”. Pearson Prentice-Hall, 2003.
  • Trucco E., Verri A.: “Introductory Techniques for 3D Computer Vision”, Prentice-Hall, 1998.

 

Metodi didattici

Agli elementi di teoria presentati a lezione si affiancano esercitazioni di laboratorio su alcuni dei principali argomenti.  Sono resi disponibili agli studenti i tool software, gli archivi di immagini\video ed il supporto che consentono l'implementazione pratica e la verifica della maggior parte degli argomenti discussi a lezione, allo scopo di rendere più profonda la conoscenza della materia.

Modalità di verifica dell'apprendimento

Gli studenti devono svolgere e presentare al docente un progetto software inerente la soluzione di una problematica reale di eleborazione immagini o visione artificiale. Il progetto può essere scelto all'interno di una lista disponibile sul sito del corso, oppure proposto direttamente dallo studente.

Successivamente, si svolge un esame orale comprendente sia la discussione del progetto sia la valutazione delle conoscenza circa gli argomenti teorici presentati durante il corso.

Strumenti a supporto della didattica

Sono disponibili sul sito del corso:

  • Tutte le slide inerenti le lezioni e le esercitazioni di laboratorio
  • Un ambiente di sviluppo Software basato sulla libreria OpenCV che consente agli studenti di implementare in maniera pratica gli algoritmi ed i metodi presentati a lezione dal docente.
  • Immagine e video che consentono agli studenti di verificare le proprie implementazioni dei concetti presentati a lezione.
  • Link ad altre risorse relative all'elaborazione di immagini e la computer vision liberamente disponibili sul web (quali tool software ed archivi di immagini e video).


Link ad altre eventuali informazioni

http://didattica.arces.unibo.it/course/view.php?id=59

Orario di ricevimento

Consulta il sito web di Luigi Di Stefano