B3096 - LABORATORIO DI BIG DATA, DATA MINING E DATA ANALYTICS - IM

Anno Accademico 2023/2024

  • Docente: Matteo Tellarini
  • Crediti formativi: 6
  • Lingua di insegnamento: Italiano

Conoscenze e abilità da conseguire

Al termine del corso, lo studente possiede competenze avanzate e capacità pratiche legate alle basi di dati relazionali e non relazionali, nonché la capacità di realizzare applicazioni centrate sull'utilizzo di DBMS. Conosce gli ambiti applicativi in cui utilizzare le tecnologie dei Big Data e le relative problematiche; Conosce le architetture hardware e software proposte per la loro gestione; Conosce le tecniche per la memorizzazione, utilizza i linguaggi e i paradigmi di programmazione adottati in questo tipo di sistemi; Conosce le metodologie di progettazione per le diverse tipologie di applicazioni in ambito Big Data. Possiede competenze pratiche nell'utilizzo delle diverse. Conosce le principali tecniche di data mining e text mining; Conosce le metodologie di gestione e sviluppo di progetto; Sviluppa competenze pratiche nella generazione, nell'analisi e interpretazione dei risultati mediante esercitazioni pratiche svolte con tool commerciali e/o open source.

Contenuti

  • Introduzione a python e alle principali librerie dell'ecosistema SciPy.
  • Nozioni di probabilità e statistica.
  • Processi di raccolta, pulizia e visualizzazione dei dati.
  • Modelli di analisi predittiva, clustering e riduzione dimensionale.
  • Tutorial con notebook Jupyter.

Testi/Bibliografia

Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani
An Introduction to Statistical Learning, Springer (2021)

Rob J. Hyndman, George Athanasopoulos
Forecasting: principles and practice, OTexts (2018)

Larry Wasserman
All of Statistics, Springer (2003)

Sebastian Raschka, Vahid Mirjalili
Python Machine Learning, Packt Publishing (2019)

Metodi didattici

  • Lezione frontale con diapositive PDF
  • Esercitazioni in laboratorio

Modalità di verifica e valutazione dell'apprendimento

  • Esercitazioni in laboratorio ed esercizi da svolgere a casa
  • Progetto di analisi dati con gli strumenti dell’ecosistema SciPy
  • Prova orale: discussione del progetto e domande sugli argomenti trattati

Strumenti a supporto della didattica

  • Diapositive PDF
  • Ambiente di sviluppo Anaconda
  • Jupyter Notebook
  • Visual Studio Code

Orario di ricevimento

Consulta il sito web di Matteo Tellarini

Consulta il sito web di Federico Bertoni