- Docente: Assimo Maris
- Crediti formativi: 6
- SSD: CHIM/02
- Lingua di insegnamento: Italiano
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Ravenna
- Corso: Laurea Magistrale in Analisi e gestione dell'ambiente (cod. 5900)
Conoscenze e abilità da conseguire
Conoscere e sapere applicare principali metodi di analisi e di modellazione di dati monovariati, bivariati e multivariati.
Contenuti
Prerequisiti
Fondamenti di statistica e teoria delle probabilità.
Programma
Elementi di ingegneria dei dati
- big data
- raccolta di dati grezzi
- trasformazione dei dati
- condivisione di dati (database, data lake, data wharehouse)
Statistica descrittiva
- Ordinamento dei dati
- Rappresentazione dei dati in forma sintetica (tabelle, grafici)
- Analisi della varianza
- Riduzione della dimensionalità dei dati (decomposizione ai valori singolari, analisi delle componenti principali, analisi dei fattori)
- Riconoscimento di strutture di relazione implicite fra i dati
2. Metodi di apprendimento
- Apprendimento supervisionato parametrico: regressione
- Apprendimento supervisionato non parametrico: classificazione
- Apprendimento non supervisionato non parametrico: clustering
- Apprendimento automatico (Machine Learning, ML)
- Reti neurali artificiali (Artificial Neural Networks, ANN)
- Algoritmi genetici (Genetic Algorithms, GA)
3. Elementi di statistica inferenziale
4. Fondamenti di programmazione in R
Testi/Bibliografia
R for Data Science, Garrett Grolemund and Hadley Wickham https://r4ds.had.co.nz/
Metodi Statistici per la Sperimentazione Biologica, A. Camussi, F. Möller, E. Ottaviano, M. Sari Gorla, Zanichelli, II edizione, 1995.
Copia del materiale didattico presentato a lezione.
Metodi didattici
L’insegnamento si compone di 6 CFU suddivisi in un modulo di teoria e un modulo di laboratorio. La lezione si svolge tramite lezioni frontali, esercizi numerici ed esercitazioni pratiche svolte utilizzando i computer degli studenti, in modo che da acquisire dimestichezza con i più comuni metodi utilizzati per la analisi statistica dei dati.
Il software utilizzato è R e ogni studente dovrà installare tale programma sul proprio PC. Il programma è gratuito e disponibile per i principali sistemi operativi (Linux, Mac, Windows). A discrezione dello studente, è possibile installare anche la versione opensource di RStudio, per un più agevole utilizzo di R.
In considerazione delle tipologie di attività e metodi didattici adottati, la frequenza di questa attività formativa richiede lo svolgimento di tutti gli studenti dei moduli 1 e 2 in modalità e-learning:
Modalità di verifica e valutazione dell'apprendimento
La verifica dell'apprendimento avviene attraverso una prova pratica e una prova orale finale volte ad accertare l'acquisizione delle conoscenze e delle abilità attese.
Strumenti a supporto della didattica
Lezioni tenute alla lavagna e con supporto del video-proiettore.
Esercizi ed esercitazioni al calcolatore.
Il materiale didattico presentato a lezione verrà messo a disposizione dello studente in formato elettronico tramite Insegnamenti On Line.
Orario di ricevimento
Consulta il sito web di Assimo Maris