29443 - VISIONE ARTIFICIALE E RICONOSCIMENTO

Anno Accademico 2018/2019

  • Docente: Annalisa Franco
  • Crediti formativi: 6
  • SSD: ING-INF/05
  • Lingua di insegnamento: Italiano

Conoscenze e abilità da conseguire

Al termine del corso, lo studente possiede le nozioni necessarie e gli strumenti per lo sviluppo di sistemi automatici per la localizzazione e il riconoscimento di oggetti a partire da immagini digitali.

Contenuti

  • Feature di colore:
    • color histograms e metriche di similarità/distanza;
    • color moments;
    • segmentazione di oggetti basata sull’analisi del colore;
  • Feature di tessitura:
    • matrici di co-occorrenza dei livelli di grigio e relative misure (entropia, contrasto, omogeneità, ecc..);
    • Filtri di Gabor: banchi di filtri, filtraggio contestuale e applicazioni all’enhancement di impronte digitali e al riconoscimento dell’iride;
    • Haar features: immagine integrale ed estrazione efficiente delle feature, applicazioni alla localizzazione del volto;
    • Local Binary Pattern: calcolo del descrittore, applicazioni al riconoscimento del volto;
  • Feature di forma:
    • Estrazione del contorno e indicatori di base (centro di gravità, circularity ratio, convexity, numero di Eulero, ecc…);
    • Rappresentazioni monodimensionali della forma (centroid distance function, ecc…);
    • Beam Angle Statistics, shape matrix, descrittori di Fourier;
    • Momenti invarianti;
    • Feature di forma per ricerche di similarità (query by sketch, es. ricerca volti tramite identikit);
  • Keypoints e descrittori locali:
    • Localizzazione dei punti di interesse: Harris corner detector;
    • Localizzazione invariante per cambiamenti di scala: Harris Laplace, Laplacian of Gaussian, Difference of Gaussian;
    • Keypoints e descrittori: descrittori SIFT, SURF, BRIEF, Histogram of Oriented Gradients.
  • Bag of visual Words:
    • Tecniche per la creazione del dizionario;
    • Applicazioni alla classificazione di immagini;
  • Tecniche di localizzazione di oggetti:
    • Template matching rigido basato su feature e applicazioni alla localizzazione di oggetti;
    • Trasformata di Hough con applicazioni all’allineamento di impronte digitali;
    • Template deformabili: tipologie di template, algoritmo Ransac per l’allineamento di immagini tramite keypoint.

Testi/Bibliografia

Forsyth e Ponce, Computer Vision a modern approach, Pearson 2012.

Gonzalez e Woods, Elaborazioni delle immagini digitali, Prentice Hall, 3 edizione, 2008.

Duda, Hart e Stork, Pattern classification, Wiley 2002.

Metodi didattici

Lezioni frontali

Esercitazioni guidate in laboratorio, individuali o di gruppo, con utilizzo di librerie pubbliche e multi-piattaforma per computer vision (es. OpenCV).

Modalità di verifica e valutazione dell'apprendimento

L'esame di fine corso mira a valutare il raggiungimento degli obiettivi didattici:

  • Conoscere le principali tecniche di estrazione di feature di forma, colore, tessitura;
  • Aver compreso le tecniche di rappresentazione di immagini basate su keypoint e descrittori locali;
  • Saper progettare e realizzare applicazioni di localizzazione e/o riconoscimento di oggetti, anche nel settore applicativo dei sistemi biometrici.

L'esame consiste nella realizzazione e discussione di un elaborato di progetto, individuale o di gruppo, e in una prova orale (sull'intero programma del corso) volta a valutare le conoscenze che lo studente ha acquisito. La discussione del progetto si svolgerà contestualmente alla prova orale e sarà formulato un giudizio complessivo.

Strumenti a supporto della didattica

Dispense a cura del docente

Tracce di esercitazioni in Python

Classi C# di ausilio alla realizzazione dell'elaborato

Orario di ricevimento

Consulta il sito web di Annalisa Franco