41574 - SISTEMI INFORMATIVI LS

Anno Accademico 2009/2010

  • Docente: Paolo Ciaccia
  • Crediti formativi: 6
  • SSD: ING-INF/05
  • Lingua di insegnamento: Italiano
  • Modalità didattica: Lezioni in presenza (totalmente o parzialmente)
  • Campus: Bologna
  • Corso: Laurea Specialistica in Ingegneria informatica (cod. 0234)

Conoscenze e abilità da conseguire

Il corso intende fornire allo studente gli strumenti necessari per poter trattare, efficacemente ed efficientemente, problemi di varia natura che riguardano i moderni sistemi informativi, illustrando le peculiarità di dati di tipo "non standard", quali documenti testuali e XML, immagini, oggetti geometrici, pagine Web e serie temporali, e fornendo, per ognuno di questi, soluzioni utili per il reperimento delle "migliori" informazioni in grado di soddisfare le preferenze degli utenti

Contenuti

  1. Introduzione al corso
    Obiettivi formativi, peculiarità dei moderni sistemi informativi, scenari applicativi (e-commerce, motori di ricerca, sistemi multimediali, disseminazione selettiva di informazioni).
  2. Interrogazioni Top-k
    Limiti dei DBMS tradizionali relativamente agli scenari applicativi prospettati. Estensioni non-standard di SQL: la clausola Stop After e l'operatore Stop. Interrogazioni Top-k multidimensionali: spazio degli attributi, pesatura degli attributi, funzioni distanza, valutazione mediante B+-tree e suoi limiti. R-tree: principi di base e algoritmi per interrogazioni di range, k nearest neighbor e distance browsing.
  3. Interrogazioni Top-k multi-sorgente
    Mediatori e wrapper (cenni). Modalità di accesso sorted e random, funzioni di scoring, relazioni con le funzioni distanza. Algoritmi B0, A0 e TA.
  4. Relazioni di preferenza
    Preferenze quantitative e qualitative, relazioni di preferenza, ordini deboli e parziali, composizione di preferenze. Interrogazioni BMO (Best-Matches-Only): l'operatore Best e l'algoritmo BNL (Block-Nested-Loops). Interrogazioni Skyline: relazione con le funzioni di scoring e algoritmo BBS (Branch and Bound Skyline).
  5. Information Retrieval testuale
    Interrogazioni Booleane, Inverted index, stemming e thesauri. Pesatura dei termini: il metodo tf.idf. Il modello Vector Space. Precision e recall. Motori di ricerca su Internet: importanza dei link nel calcolo della rilevanza. La tecnica PageRank di Google. Hub e Authority. Ricerche approssimate su documenti XML: principi generali.
  6. Information Retrieval multimediale
    Ricerca basata sul contenuto, estrazione di caratteristiche e loro approssimazione. La strategia di ricerca Filter & Refine (F&R): lemma L-B, ricerche k nearest neighbor in modalità multi-step. Basi di dati di immagini: spazi di colore, istogrammi di colore e distanza quadratica, tessitura e filtri di Gabor (cenni), forma di oggetti e rappresentazione parametrica. Serie temporali: riduzione di dimensionalità mediante DFT (Discrete Fourier Transform) e PAA (Piecewise Aggregate Approximation), allineamento basato su distanza DTW (Dynamic Time Warping). Relevance feedback: principi ed esempi, tecniche di base.
  7. Indicizzazione di dati multimediali
    Il caso vettoriale: R-tree e algoritmi di gestione (inserimento e split). Spazi metrici: principi di indicizzazione, M-tree. Spazi a elevata dimensionalità: conseguenza sulle prestazioni degli algoritmi di ricerca, X-tree e VA-file.

Testi/Bibliografia

Il corso non adotta libri di  testo. Il materiale didattico consiste di copia delle slide proiettate a lezione, reperibili sia sul sito del corso (http://www-db.deis.unibo.it/courses/SI-LS/) che presso la biblioteca della Facoltà.

Per ogni argomento trattato sono inoltre disponibili sul sito del corso, a scopo di approfondimento, copie dei lavori referenziati nei lucidi

Metodi didattici

Il corso introduce, motivandole con esempi intuitivi, una serie di problematiche di attualità e spesso non ancora risolte in modo soddisfacente, e per ognuna di esse descrive gli approcci risolutivi maggiormente significativi. Lo studente viene inoltre stimolato a ricercare analogie tra problemi apparentemente non correlati e ad applicare ad altri contesti le tecniche apprese a lezione.

Al fine di garantire continuità con gli insegnamenti di Sistemi Informativi impartiti nel triennio, le problematiche trattate vengono presentate, ove possibile, come naturale evoluzione delle funzionalità proprie dei sistemi informativi di tipo tradizionale.

Modalità di verifica e valutazione dell'apprendimento

La prova di accertamento è orale e verte su quanto trattato a lezione. A ogni studente è inoltre richiesto di produrre un elaborato in forma scritta che approfondisca un argomento inerente i contenuti del corso. La forma di tale elaborato può variare, anche in funzione del numero di studenti in aula, e può consistere, ad esempio, nella preparazione di una presentazione, nella stesura di una "tesina" o nello sviluppo di un sistema software

Strumenti a supporto della didattica

Le lezioni vengono svolte con l'ausilio di lucidi (prevalentemente redatti in lingua inglese) proiettati mediante videoproiettore e PC

Link ad altre eventuali informazioni

http://www-db.deis.unibo.it/courses/SI-LS/

Orario di ricevimento

Consulta il sito web di Paolo Ciaccia