96143 - METODI E MODELLI DI DATA ANALYTICS M

Scheda insegnamento

Anno Accademico 2021/2022

Conoscenze e abilità da conseguire

Fornire i concetti, le tecniche e gli strumenti per la progettazione e l'implementazione di processi di "data anlytics" e "data valorization". Illustrare tutte le fasi del processo di gestione e analisi di dati, dall'acquisizione e processamento iniziale, alla generazione di nuova conoscenza attraverso tecniche statistiche e di Machine Learning, fino alla visualizzazione e valutazione delle performance. Presentare le principali applicazioni aziendali di data analytics e i principali scenari tecnologici in questo ambito.

Contenuti

A causa della mutuazione di moduli in atto per l'A.A. 2021/2022, questa Guida Web copre i seguenti tre insegnamenti, per i quali è indicata la composizione in Moduli:

 

69499 - BUSINESS INTELLIGENCE M

  1. Data Warehousing (Stefano Rizzi)
  2. Data Mining (Fabio Grandi)

96142 - BUSINESS INTELLIGENCE E BIG DATA M

  1. Data Warehousing (Stefano Rizzi)
  2. Big Data (Federico Ravaldi)

96143 - METODI E MODELLI DI DATA ANALYTICS M

  1. Data Mining (Fabio Grandi)
  2. Metodi di Intelligenza Artificiale (Andrea Borghesi)

 

Nel seguito sono descritti i Contenuti dei Moduli componenti

_____________________________________________________

 

DATA WAREHOUSING

 

Prerequisiti/Propedeuticità consigliate

L’allievo che accede a questo insegnamento conosce i sistemi database e il modello relazionale. Tali conoscenze sono acquisite, di norma, superando un esame di Basi di Dati o Sistemi Informativi.

Tutte le lezioni saranno tenute in Italiano. È quindi necessaria la comprensione della lingua italiana per seguire con profitto il corso e per poter utilizzare il materiale didattico fornito.

 

Programma 

  • la BI nel sistema informativo aziendale
  • la piramide della BI
  • introduzione al data warehousing
  • architetture
  • tecniche di analisi dei dati: reportistica e OLAP
  • il ciclo di sviluppo
  • analisi delle sorgenti dati
  • analisi dei requisiti
  • progettazione concettuale
  • carico di lavoro e volume dati
  • progettazione logica
  • progettazione dell'alimentazione

_____________________________________________________

 

DATA MINING

 

Prerequisiti/Propedeuticità consigliate

L’allievo che accede a questo insegnamento conosce i sistemi database e il modello relazionale. Tali conoscenze sono acquisite, di norma, superando un esame di Basi di Dati o Sistemi Informativi.

Tutte le lezioni saranno tenute in Italiano. È quindi necessaria la comprensione della lingua italiana per seguire con profitto il corso e per poter utilizzare il materiale didattico fornito.

 

Programma

  • introduzione al data mining e KDD
  • regole associative
  • algoritmi di clustering
  • tipologie dei dati
  • alberi di decisione
  • metodi statistici
  • reti neurali
  • valutazione dei risultati
  • analisi di serie storiche
  • individuazione di outlier

_____________________________________________________

 

BIG DATA

 

Prerequisiti/Propedeuticità consigliate

L’allievo che accede a questo insegnamento conosce i sistemi database e il modello relazionale. Tali conoscenze sono acquisite, di norma, superando un esame di Basi di Dati o Sistemi Informativi.

Tutte le lezioni saranno tenute in Italiano. È quindi necessaria la comprensione della lingua italiana per seguire con profitto il corso e per poter utilizzare il materiale didattico fornito.

 

Programma

  • la rivoluzione dei dati
  • big data: caratteristiche, definizioni e stato dell’arte
  • sorgenti Informative: Internet of Things (IoT), Industry 4.0, ERP, Social network, Geo Data, ecc.
  • database NoSQL
  • architetture: data platform, data lake e cloud
  • workshop: Hadoop ecosytem & Spark
  • analisi in tempo reale: fast data, lambda architecture, Kafka
  • data strategy
  • casi di studio

_____________________________________________________

 

METODI DI INTELLIGENZA ARTIFICIALE

 

Prerequisiti/Propedeuticità consigliate

Sono propedeutiche al corso conoscenze di base di ottimizzazione e programmazione lineare ed intera. Tali conoscenze sono, in genere, acquisibili superando esami di Ricerca Operativa e Algoritmi per il Supporto alle Decisioni e Gestione delle Risorse.

Tutte le lezioni saranno tenute in Italiano. È quindi necessaria la comprensione della lingua italiana per seguire con profitto il corso e per poter utilizzare il materiale didattico fornito.

 

Programma 

  • programmazione a vincoli
  • deep learning
  • selezione e configurazione automatica di algoritmi
  • manutenzione predittiva
  • rilevazione di anomalie
  • serie temporali
  • manutenzione prescrittiva
  • casi d'uso

Testi/Bibliografia

 

DATA WAREHOUSING

  • Lucidi del corso. 
  • M. Golfarelli, S. Rizzi. Data Warehouse: teoria e pratica della progettazione (seconda edizione). McGraw-Hill, 2006.

Letture consigliate:

  • B. Devlin. Data warehouse: from architecture to implementation. Addison-Wesley Longman, 1997.
  •  W.H. Inmon. Building the data warehouse. John Wiley & Sons, 1996.
  • M. Jarke, M. Lenzerini, Y. Vassiliou, P. Vassiliadis. Fundamentals of data warehouse. Springer, 2000.
  • R. Kimball, L. Reeves, M. Ross, W. Thornthwaite. The data warehouse lifecycle toolkit. John Wiley & Sons, 1998.

 

DATA MINING

  • Lucidi del corso.
  • I.H. Witten, E.Frank, M.A. Hall, Data Mining: Practical Machine Learning Tools and Techniques (terza edizione), Morgan Kaufmann, 2011.

Letture consigliate:

  • M. Berry, G. Linoff. Data mining techniques for marketing, sales, and customer support. John Wiley & Sons, 1997.
  • R. Roiger, M. Geatz, Introduzione al data mining, McGraw-Hill, 2003.

 

BIG DATA

  • Dispense del corso.

Letture consigliate:

  • P. Sadalage, M. Fowler. NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence. Addison-Wesley, 2009.
  • T. White. Hadoop: The Definitive Guide, Storage and Analysis at Internet Scale - 4th Edition. O'Reilly Media, 2015 (capitoli suggeriti: 1,2,3,4,19)

 

METODI DI INTELLIGENZA ARTIFICIALE

  • Dispense del corso
  • I. Goodfellow, Y. Bengio, A. Courville, Deep Learning book, MIT Press, 2016 https://www.deeplearningbook.org/ 
  • T. Rossi, P. van Beek, T. Walsh, Handbook of Constraint Programming, Elsevier, 2006

 

Metodi didattici

  • La didattica frontale dei moduli consiste in lezioni ed esercitazioni in aula, svolte dal docente con l'ausilio di PC e proiettore. Eventuali lezioni online o in modalità mista saranno erogate utilizzando la piattaforma Teams.
  • Il programma sarà integrato da seminari tenuti da consulenti aziendali.
  • Il modulo di Data Warehousing prevede lo svolgimento di esercitazioni di gruppo su lavagne collaborative virtuali.

Modalità di verifica e valutazione dell'apprendimento

L'esame finale mira ad accertare la conoscenza acquisita dallo studente, relativamente ai contenuti specifici dei singoli moduli, dei principali strumenti e metodi per la gestione e l'analisi di grandi quantità di dati utili a supportare efficientemente i processi decisionali. Gli esami verranno effettuati in presenza o online, a seconda della situazione sanitaria e delle disposizioni dell'Ateneo. Nel caso online, si utilizzeranno gli strumenti Zoom e EOL.

Le prove di tutti i moduli verranno svolte separatamente. Ciascuna prova consiste in uno scritto della durata di 60 minuti, durante il quale è espressamente vietato consultare libri e appunti. Per il modulo Data Warehousing, il testo dell'esame si compone di una parte progettuale, che richiede di risolvere un esercizio di progettazione concettuale e logica di data warehouse, e di una parte teorica che include alcune domande sui contenuti dell'intero corso. Per il modulo Data Mining, l'esame consiste in due quesiti a risposta aperta (a scelta su tre) riguardanti i principali argomenti del corso. Per il modulo Big Data, il testo dell’esame è composto da quesiti in forma aperta su contenuti teorici e progettuali. Per il modulo Metodi di Intelligenza Artificiale, l'esame consiste in due quesiti a risposta aperta (a scelta su tre) riguardanti i principali argomenti del corso. Ciascuna prova si intende superata con un punteggio di 18/30 su un totale di 32/30. Ulteriori dettagli verranno comunicati a lezione e nelle "note" abbinate agli appelli pubblicati su AlmaEsami.

Per sostenere la prova d'esame è necessaria l'iscrizione tramite AlmaEsami, nel rispetto delle scadenze previste. Coloro che non riuscissero a iscriversi entro la data prevista, sono tenuti a comunicare tempestivamente (e comunque prima della chiusura ufficiale delle liste di iscrizione) il problema alla segreteria didattica. Sarà facoltà del docente ammetterli a sostenere la prova. Le prove relative ai due moduli componenti di ciascun insegnamento possono essere sostenute nel corso dello stesso appello o in appelli differenti, in qualunque ordine. Una volta pubblicato il risultato della prova, ciascuno studente ha una settimana di tempo per comunicare via email al docente se intende rifiutare il voto conseguito. Il voto complessivo dell'esame, assegnato in trentesimi, verrà calcolato come media dei voti conseguiti nei due moduli componenti.

Il superamento dell’esame sarà garantito agli studenti che dimostreranno padronanza e capacità operativa in relazione alla conoscenza dei concetti chiave illustrati nell'insegnamento, alle capacità progettuali ed alla padronanza del linguaggio tecnico. Un punteggio più elevato sarà attribuito agli studenti che dimostreranno di aver compreso pienamente e saper utilizzare al meglio tutti i contenuti dell’insegnamento illustrandoli con capacità di linguaggio, risolvendo problemi anche complessi con buone attitudini progettuali.

Strumenti a supporto della didattica

  • Materiale didattico scaricabile dalla piattaforma Virtuale
  • Piattaforma Teams per la didattica a distanza.
  • Piattaforma Miro per le esercitazioni.

Orario di ricevimento

Consulta il sito web di Fabio Grandi

Consulta il sito web di Andrea Borghesi