11396 - ANALISI STATISTICA MULTIVARIATA

Anno Accademico 2021/2022

  • Docente: Assimo Maris
  • Crediti formativi: 6
  • SSD: MAT/06
  • Lingua di insegnamento: Italiano
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Ravenna
  • Corso: Laurea Magistrale in Analisi e gestione dell'ambiente (cod. 8418)

Conoscenze e abilità da conseguire

Al termine del corso, lo studente possiede una conoscenza dell'Analisi Statistica Multivariata per il trattamento dei dati. E' in grado di utilizzare gli strumenti delle Distribuzioni normali multivariate, l'Analisi Multipla della Varianza, l'Analisi delle Componenti Principali e Fattoriale.

Contenuti

Prerequisiti

Conoscenza dei principali concetti relativi alla statistica univariata e della teoria delle probabilità.

Programma

• Elementi di programmazione in R

• Pretrattamento dei dati: Trasformazione delle variabili, Gestione dei dati mancanti.

• Applicazione di Tecniche multivariate: concetti generali. Organizzazione dei dati: Matrici, Statistica descrittiva multivariata, Tecniche grafiche, Distanza statistica

• Pretrattamento dei dati: Trasformazione delle variabili, Gestione dei dati mancanti.

• Vettori e Matrici Casuali: Vettore media e Matrice di Varianza/Covarianza, Valore di Attesa, Media Marginale e Vettore Media di popolazione, Varianza e Covarizanza Marginali e Matrice di Varianza-Covarianza di popolazione.

• Campioni casuali e valori attesi per il vettore media e la Matrice di Covarianza campionarie. Varianza Generalizzata e Varianza totale campionarie.

• Componenti Principali: definizione ed interpretazione. Componenti Principali da variabili standardizzate. Analisi della variabilita' dei dati mediante l'uso delle componenti principali. Studio grafico dei componenti principali (grafici dei loadings, grafici degli scores, scelta delle componenti principali da scree plot).

•Analisi dei fattori

• Modello classico di regressione lineare multivariata. La Stima col metodo dei minimi quadrati. Regione di confidenza per i parametri di regressione. Valutazione del modello mediante i valori stimati. Stime del valore atteso e previsione di una nuova osservazione. Metodo di Regressione in Componenti Principali (PCR). Metodo Partial Least Squares (PLS).

• Distribuzione Normale multivariata: dal caso univariato al multivariato, proprietà fondamentali, curve di livello. Verosimiglianza Normale Multivariata. Comportamento per grandi campioni. Test sull'ipotesi di normalita': Plot Q-Q. Trasformazioni per quasi-normalita'.

• Misure di dissimilarità (distanze). Misure di similarità e associazione. Analisi di Clusters con metodi di aggregazione. Dendrogrammi. Custer analisi su PCA. Metodi di classificazione.

• Introduzione ai metodi di apprendimento automatico: reti neurali e algoritmi evoluzionistici.

• La Statistica T² di Hotelling: ipotesi statistiche e test di significatività, dal test t-student al test T². Regioni di confidenza e intervalli di confidenza simultanei per il vettore media di una distribuzione normale multivariata. Il caso di grandi campioni. Grafici di controllo qualità multivariato.

• Confronto di coppie di trattamenti: Statistica accoppiata. Confronto di vettori di media tra due popolazioni: Caso di uguale matrice di covarianza, Caso di matrici di covarianza diverse. Confronto di medie di varie popolazioni multivariate: dal caso univariato (test di Fisher) al caos multivariato (MANOVA: test sul Λ di Wilks).

Testi/Bibliografia

Applied Multivariate Statistical Analysis, R. A. Johnson e D. W. Wichern, Prentice Hall, V edizione, 2002

Introduzione alla chemiometria, Tedeschi Roberto, Edises, 1998

Metodi Statistici per la Sperimentazione Biologica, A. Camussi, F. Möller, E. Ottaviano, M. Sari Gorla, Zanichelli, II edizione, 1995.

Copia del materiale didattico presentato a lezione.

Metodi didattici

L’insegnamento si compone di 6 CFU suddivisi in un modulo di teoria  e un modulo di laboratorio. La lezione si svolge tramite lezioni frontali, esercizi numerici ed esercitazioni pratiche svolte utilizzando i computer degli studenti, in modo che da acquisire dimestichezza con i più comuni metodi utilizzati per la analisi statistica dei dati.

Il software utilizzato è R e ogni studente dovrà installare tale programma sul proprio PC. Il programma è gratuito e disponibile per i principali sistemi operativi (Linux, Mac, Windows). A discrezione dello studente, è possibile installare anche la versione opensource di RStudio, per un più agevole utilizzo di R.

In considerazione delle tipologie di attività e metodi didattici adottati, la frequenza di questa attività formativa richiede lo svolgimento di tutti gli studenti dei moduli 1 e 2 in modalità e-learning:

https://elearning-sicurezza.unibo.it/

https://www.unibo.it/it/servizi-e-opportunita/salute-e-assistenza/salute-e-sicurezza/sicurezza-e-salute-nei-luoghi-di-studio-e-tirocinio

Modalità di verifica e valutazione dell'apprendimento

La verifica dell'apprendimento avviene attraverso esercizi pratici in itinere e una prova orale finale volti ad accertare l'acquisizione delle conoscenze e delle abilità attese.

 

Strumenti a supporto della didattica

1) Lezioni tenute alla lavagna e con supporto del video-proiettore.

2) Esercizi ed esercitazioni al calcolatore.

3) Il materiale didattico presentato a lezione verrà messo a disposizione dello studente in formato elettronico tramite Insegnamenti On Line.

Orario di ricevimento

Consulta il sito web di Assimo Maris

SDGs

Istruzione di qualità

L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.