96009 - LABORATORIO DI BIG DATA, DATA MINING E DATA ANALYTICS

Anno Accademico 2022/2023

  • Docente: Marco Calbucci
  • Crediti formativi: 6
  • Lingua di insegnamento: Italiano
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Cesena
  • Corso: Laurea in Tecnologie dei sistemi informatici (cod. 5816)

Conoscenze e abilità da conseguire

Al termine del corso, lo studente possiede competenze avanzate e capacità pratiche legate alle basi di dati relazionali e non relazionali, nonché la capacità di realizzare applicazioni centrate sull'utilizzo di DBMS. Conosce gli ambiti applicativi in cui utilizzare le tecnologie dei Big Data e le relative problematiche; Conosce le architetture hardware e software proposte per la loro gestione; Conosce le tecniche per la memorizzazione, utilizza i linguaggi e i paradigmi di programmazione adottati in questo tipo di sistemi; Conosce le metodologie di progettazione per le diverse tipologie di applicazioni in ambito Big Data. Possiede competenze pratiche nell'utilizzo delle diverse. Conosce le principali tecniche di data mining e text mining; Conosce le metodologie di gestione e sviluppo di progetto; Sviluppa competenze pratiche nella generazione, nell'analisi e interpretazione dei risultati mediante esercitazioni pratiche svolte con tool commerciali e/o open source.

Contenuti

  • Introduzione a python e alle librerie numpy e pandas.
  • Nozioni di statistica.
  • Visualizzazione dati con matplotlib e pandas.
  • Processi di raccolta e pulizia dati.
  • Modelli di analisi predittiva (regressioni, classificazioni) con scikit-learn.

Testi/Bibliografia

Foster Provost, Tom Fawcett

Data science for business, O'Reilly (2013)

 

John V. Guttag,

Introduction to computation and programming using Python, The MIT Press (2016)

 

Cole Nussbaumer Knaflic,

Storytelling with data, Wiley (2015)

Metodi didattici

Lezione frontale con diapositive Power Point

Esercitazioni in classe su console Jupyter

 

Modalità di verifica e valutazione dell'apprendimento

Esercitazioni in classe

Progetto di analisi dati con Pandas

Prova orale: discussione del progetto e domande sugli argomenti trattati

 

Strumenti a supporto della didattica

Diapositive Power Point

Piattaforma Anaconda, editor Jupyter

Orario di ricevimento

Consulta il sito web di Marco Calbucci