- Docente: Stefano Lodi
- Crediti formativi: 5
- SSD: ING-INF/05
- Lingua di insegnamento: Italiano
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Rimini
- Corso: Laurea Specialistica in Sistemi informativi aziendali (cod. 0366)
Conoscenze e abilità da conseguire
Il corso si propone di descrivere e far comprendere le tecnologie
di data warehousing e il processo di scoperta di conoscenza nelle
basi di dati e il loro ruolo nella business intelligence. In
particolare, sono descritti i fondamentali algoritmi di data mining
e se ne analizzano sia le caratteristiche operative che i casi di
impiego. Vengono discusse le differenze tra i requisiti di
elaborazione in ambiente centralizzato, distribuito, e stream e
vengono descritte le principali tecniche per soddisfare tali
requisiti. Il corso comprende esercitazioni di laboratorio in cui
vengono sperimentate le implementazioni dei principali algoritmi di
data mining su basi di dati reali.
Contenuti
Data warehousing. Data warehousing e business intelligence.
OLTP e OLAP. Architettura di un data warehouse. Schemi e operazioni
in un data warehouse.
Knowledge Discovery. Knowledge discovery e business
intelligence. Il processo di knowledge discovery. Algoritmi di Data
Mining: regole associative; algoritmo APRIORI; clustering di dati
vettoriali : algoritmi one-pass, algoritmo BIRCH; algoritmi di
clustering basati sulla densità: algoritmi DBSCAN, DENCLUE;
clustering di dati categorici: cenni. Clustering di dati metrici:
cenni. Algoritmi di Data Mining distribuito: privacy e cooperazione
nel data mining di dati distribuiti; algoritmi distribuiti per le
regole associative; algoritmi distribuiti per il clustering;
algoritmi distribuiti per la classificazione. Algoritmi per stream
di dati: calcolo di informazioni aggregate da stream di dati;
clustering di stream di dati: time frame piramidali e algoritmo
CluStream. Esercitazioni di laboratorio: IBM Intelligent Miner,
Microsoft SQL Server.
Testi/Bibliografia
Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques, The Morgan Kaufmann Series in Data Management Systems, Jim Gray, Series Editor. Morgan Kaufmann Publishers, August 2000. 550 pages. ISBN 1-55860-489-8
Metodi didattici
Nelle lezioni frontali vengono descritti funzionamento, limiti di
applicabilità e la complessità computazionale dei principali
algoritmi di data mining. Durante l'attività di laboratorio si
sperimentano strumenti software di data mining commerciali su dati
reali e artificiali e si discutono collettivamente i risultati
ottenuti.
Modalità di verifica e valutazione dell'apprendimento
- Prova pratica con strumenti di data warehousing e data
mining
- Prova orale
Strumenti a supporto della didattica
- PC e videoproiettore
- Laboratorio di PC Software:
- Database Management System IBM DB2 Express-C
- IBM Intelligent Miner
- Microsoft SQL server
Link ad altre eventuali informazioni
http://www-db.deis.unibo.it/~slodi/SISD/2008-2009/sisd.html
Orario di ricevimento
Consulta il sito web di Stefano Lodi