99107 - SCIENZA DEI DATI PER L'AMBIENTE

Anno Accademico 2022/2023

  • Docente: Assimo Maris
  • Crediti formativi: 6
  • SSD: CHIM/02
  • Lingua di insegnamento: Italiano
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Ravenna
  • Corso: Laurea Magistrale in Analisi e gestione dell'ambiente (cod. 5900)

Conoscenze e abilità da conseguire

Conoscere e sapere applicare principali metodi di analisi e di modellazione di dati monovariati, bivariati e multivariati.

Contenuti

Prerequisiti

Fondamenti di statistica e teoria delle probabilità.

Programma

Elementi di ingegneria dei dati

  • big data
  • raccolta di dati grezzi
  • trasformazione dei dati
  • condivisione di dati (database, data lake, data wharehouse)

Statistica descrittiva

  • Ordinamento dei dati
  • Rappresentazione dei dati in forma sintetica (tabelle, grafici)
  • Analisi della varianza
  • Riduzione della dimensionalità dei dati (decomposizione ai valori singolari, analisi delle componenti principali, analisi dei fattori)
  • Riconoscimento di strutture di relazione implicite fra i dati

2. Metodi di apprendimento

  • Apprendimento supervisionato parametrico: regressione
  • Apprendimento supervisionato non parametrico: classificazione
  • Apprendimento non supervisionato non parametrico: clustering
  • Apprendimento automatico (Machine Learning, ML)
  • Reti neurali artificiali (Artificial Neural Networks, ANN)
  • Algoritmi genetici (Genetic Algorithms, GA)

3. Elementi di statistica inferenziale

4. Fondamenti di programmazione in R

Testi/Bibliografia

R for Data Science, Garrett Grolemund and Hadley Wickham  https://r4ds.had.co.nz/

Metodi Statistici per la Sperimentazione Biologica, A. Camussi, F. Möller, E. Ottaviano, M. Sari Gorla, Zanichelli, II edizione, 1995.

Copia del materiale didattico presentato a lezione.

Metodi didattici

L’insegnamento si compone di 6 CFU suddivisi in un modulo di teoria e un modulo di laboratorio. La lezione si svolge tramite lezioni frontali, esercizi numerici ed esercitazioni pratiche svolte utilizzando i computer degli studenti, in modo che da acquisire dimestichezza con i più comuni metodi utilizzati per la analisi statistica dei dati.

Il software utilizzato è R e ogni studente dovrà installare tale programma sul proprio PC. Il programma è gratuito e disponibile per i principali sistemi operativi (Linux, Mac, Windows). A discrezione dello studente, è possibile installare anche la versione opensource di RStudio, per un più agevole utilizzo di R.

In considerazione delle tipologie di attività e metodi didattici adottati, la frequenza di questa attività formativa richiede lo svolgimento di tutti gli studenti dei moduli 1 e 2 in modalità e-learning: 

https://www.unibo.it/it/servizi-e-opportunita/salute-e-assistenza/salute-e-sicurezza/sicurezza-e-salute-nei-luoghi-di-studio-e-tirocinio

Modalità di verifica e valutazione dell'apprendimento

La verifica dell'apprendimento avviene attraverso una prova pratica e una prova orale finale volte ad accertare l'acquisizione delle conoscenze e delle abilità attese.

Strumenti a supporto della didattica

Lezioni tenute alla lavagna e con supporto del video-proiettore.

Esercizi ed esercitazioni al calcolatore.

Il materiale didattico presentato a lezione verrà messo a disposizione dello studente in formato elettronico tramite Insegnamenti On Line.

Orario di ricevimento

Consulta il sito web di Assimo Maris