48113 - SISTEMI INFORMATIVI PER IL SUPPORTO ALLE DECISIONI

Anno Accademico 2008/2009

  • Docente: Stefano Lodi
  • Crediti formativi: 5
  • SSD: ING-INF/05
  • Lingua di insegnamento: Italiano
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Rimini
  • Corso: Laurea Specialistica in Sistemi informativi aziendali (cod. 0366)

Conoscenze e abilità da conseguire

Il corso si propone di descrivere e far comprendere le tecnologie di data warehousing e il processo di scoperta di conoscenza nelle basi di dati e il loro ruolo nella business intelligence. In particolare, sono descritti i fondamentali algoritmi di data mining e se ne analizzano sia le caratteristiche operative che i casi di impiego. Vengono discusse le differenze tra i requisiti di elaborazione in ambiente centralizzato, distribuito, e stream e vengono descritte le principali tecniche per soddisfare tali requisiti. Il corso comprende esercitazioni di laboratorio in cui vengono sperimentate le implementazioni dei principali algoritmi di data mining su basi di dati reali.

Contenuti

Data warehousing. Data warehousing e business intelligence. OLTP e OLAP. Architettura di un data warehouse. Schemi e operazioni in un data warehouse.
Knowledge Discovery. Knowledge discovery e business intelligence. Il processo di knowledge discovery. Algoritmi di Data Mining: regole associative; algoritmo APRIORI; clustering di dati vettoriali : algoritmi one-pass, algoritmo BIRCH; algoritmi di clustering basati sulla densità: algoritmi DBSCAN, DENCLUE; clustering di dati categorici: cenni. Clustering di dati metrici: cenni. Algoritmi di Data Mining distribuito: privacy e cooperazione nel data mining di dati distribuiti; algoritmi distribuiti per le regole associative; algoritmi distribuiti per il clustering; algoritmi distribuiti per la classificazione. Algoritmi per stream di dati: calcolo di informazioni aggregate da stream di dati; clustering di stream di dati: time frame piramidali e algoritmo CluStream. Esercitazioni di laboratorio: IBM Intelligent Miner, Microsoft SQL Server.

Testi/Bibliografia

Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques, The Morgan Kaufmann Series in Data Management Systems, Jim Gray, Series Editor. Morgan Kaufmann Publishers, August 2000. 550 pages. ISBN 1-55860-489-8

Metodi didattici

Nelle lezioni frontali vengono descritti funzionamento, limiti di applicabilità e la complessità computazionale dei principali algoritmi di data mining. Durante l'attività di laboratorio si sperimentano strumenti software di data mining commerciali su dati reali e artificiali e si discutono collettivamente i risultati ottenuti.

Modalità di verifica e valutazione dell'apprendimento

  • Prova pratica con strumenti di data warehousing e data mining
  • Prova orale

Strumenti a supporto della didattica

  • PC e videoproiettore
  • Laboratorio di PC
  • Software:
    • Database Management System IBM DB2 Express-C
    • IBM Intelligent Miner
    • Microsoft SQL server

Link ad altre eventuali informazioni

http://www-db.deis.unibo.it/~slodi/SISD/2008-2009/sisd.html

Orario di ricevimento

Consulta il sito web di Stefano Lodi