99107 - SCIENZA DEI DATI PER L'AMBIENTE

Anno Accademico 2023/2024

  • Docente: Assimo Maris
  • Crediti formativi: 6
  • SSD: CHIM/02
  • Lingua di insegnamento: Italiano
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Ravenna
  • Corso: Laurea Magistrale in Analisi e gestione dell'ambiente (cod. 5900)

Conoscenze e abilità da conseguire

Conoscere e sapere applicare principali metodi di analisi e di modellazione di dati monovariati, bivariati e multivariati.

Contenuti

Prerequisiti

Fondamenti di statistica e teoria delle probabilità.

Programma

Elementi di ingegneria dei dati

  • big data
  • raccolta di dati grezzi
  • trasformazione dei dati
  • condivisione di dati (database, data lake, data wharehouse)

Statistica descrittiva

  • Rappresentazione dei dati in forma sintetica (tabelle, grafici)
  • Ordinamento e distribuzione dei dati
  • Matrici codevianza, covarianza e correlazione
  • Riduzione della dimensionalità dei dati (decomposizione ai valori singolari, analisi delle componenti principali, analisi dei fattori)
  • Riconoscimento di strutture di relazione implicite fra i dati

Metodi di apprendimento

  • Apprendimento supervisionato parametrico: regressione lineare
  • Apprendimento supervisionato non parametrico: classificazione
  • Apprendimento non supervisionato non parametrico: clustering
  • Apprendimento automatico (Machine Learning, ML)
  • Reti neurali artificiali (Artificial Neural Networks, ANN)
  • Algoritmi genetici (Genetic Algorithms, GA)

Elementi di statistica inferenziale

Fondamenti di programmazione in R

Indagine statistica anonima

Una volta raggiunto il limite dei 2/3 delle lezioni svolte verrà effettuata una rilevazione statistica per conoscere le opinioni degli studenti in merito al corso allo scopo di poterlo rendere più efficace. Siti di riferimento:

Calendario

  • 27/10/2023  TH datascience.pdf LAB calcolatrice.r
  • 03/11/2023  TH statistica.pdf LAB plotter.r
  • 10/11/2023  TH descrittori.pdf LAB variabili.r, io.r, cicli.r
  • 17/11/2023  TH descrittori.pdf LAB tss.r
  • 24/11/2023  LAB vettorinum.r, vettoricat.r
  • 01/12/2023  TH descrittori.pdf LAB matrici.r iris.r janitor.r
  • 15/12/2023  TH regressione.pdf LAB janitor.r +pratica
  • 08/01/2024  Prova parziale intermedia (2h)
  • 08/01/2024  TH regressione.pdf (2h)
  • 12/01/2024  TH regressione.pdf LAB lm.r
  • 15/01/2024  TH EA.pdf LAB lm_ols_chlorella.r
  • 19/01/2024  TH PCA.pdf LAB lm_ga_chlorella.r
  • 22/01/2024  LAB pca_chlorella.r (2h)
  • 26/01/2024  TH PCA.pdf
  • 29/01/2024  TH classificazione (2h)
  • 02/02/2024  TH clustering/reti neurali + Rilevazione statistica
  • 06/02/2024  Prova parziale finale, h 11 Aula Master

Testi/Bibliografia

Metodi didattici

L’insegnamento si compone di 6 CFU suddivisi in due moduli:

  • modulo di teoria, 4 CFU, 32 h
  • modulo di laboratorio, 2 CFU, 24 h

La lezione tipicamente ha una durata di 4 ore e prevede una parte teorica seguita da esercizi numerici ed esercitazioni pratiche svolte utilizzando i computer degli studenti, in modo che da acquisire dimestichezza con alcuni dei metodi alla base della materia.

Il software utilizzato è R e ogni studente dovrà installare tale programma sul proprio computer prima dell'inizio delle lezioni.

Il programma è gratuito e disponibile per i principali sistemi operativi:

  • Linux
  • MacOS (installare anche XQuartz per attivare l'interfaccia grafica)
  • Windows

Si richiede altresì di installare l'ultima versione di:

E' possibile installare a uso facoltativo:

In considerazione delle tipologie di attività e metodi didattici adottati, la frequenza di questa attività formativa richiede lo svolgimento dei moduli 1 e 2 in modalità e-learning:

Modalità di verifica e valutazione dell'apprendimento

La verifica dell'apprendimento è volta ad accertare l'acquisizione sia delle conoscenze teoriche che delle abilità pratiche attese.

Durante il corso si prevedono 2 prove parziali:

  1. prova intermedia a metà corso
    - scritto: domande di teoria ed esercizi numerici
    - pratico: programmazione in R con accesso alle risorse online
  2. prova finale al termine del corso
    - scritto: domande di teoria
    - pratico: programmazione in R con accesso alle risorse online

Il voto finale è dato dalla media dei voti delle 2 prove.

Nelle sessioni di esame ordinarie la verifica dell'apprendimento avviene attraverso un singolo esame, che accerta l'acquisizione delle conoscenze e delle abilità attese tramite lo svolgimento di una prova orale affiancata da una prova pratica di programmazione in R.

Il voto finale esprime una valutazione sui contenuti espressi durante la prova finale.

Strumenti a supporto della didattica

Lezioni tenute alla lavagna e con supporto del video-proiettore.

Esercizi numerici.

Esercitazioni al computer (personale).

Il materiale didattico presentato a lezione verrà messo a disposizione dello studente in formato elettronico sul sito istituzionale del corso:

Coloro che necessitino di strumenti compensativi per ragioni dipendenti da disabilità, patologie o disturbi psicologici, o disturbi specifici dell’apprendimento (DSA) possono concordare l’adozione delle misure più opportune. rivolgendosi a:

 

Orario di ricevimento

Consulta il sito web di Assimo Maris

SDGs

Istruzione di qualità

L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.