- Docente: Cristina Puzzarini
- Crediti formativi: 6
- SSD: MAT/06
- Lingua di insegnamento: Italiano
- Moduli: Cristina Puzzarini (Modulo 1) Massimo Marcaccio (Modulo 2)
- Modalità didattica: Convenzionale - Lezioni in presenza (Modulo 1) Convenzionale - Lezioni in presenza (Modulo 2)
- Campus: Ravenna
- Corso: Laurea Magistrale in Analisi e gestione dell'ambiente (cod. 8418)
Conoscenze e abilità da conseguire
Al termine del corso, lo studente possiede una conoscenza dell'Analisi Statistica Multivariata per il trattamento dei dati. E' in grado di utilizzare gli strumenti delle Distribuzioni normali multivariate, l'Analisi Multipla della Varianza, l'Analisi delle Componenti Principali e Fattoriale.
Contenuti
• L'organizzazione dei dati. Statistica descrittiva
multivariata.
• Misure di dissimilarita' (distanze). Misure di similarita' e
associazione. Analisi di Clusters con metodi di aggregazione.
• Multidimensional scaling classico.
• Vettori e Matrici Casuali. Vettore media e Matrice di
Varianza/Covarianza. Combinazioni lineari di vettori casuali e loro
media e varianza. Campioni casuali e valori attesi per il vettore
media e la Matrice di Covarianza campionarie. Varianza
Generalizzata e Varianza totale campionarie.
• La distribuzione normale multivariata. Funzione di densita' e
proprieta' fondamentali. La distribuzione campionaria della media e
della matrice di covarianza. Comportamento per grandi campioni.
Test sull'ipotesi di normalita'. Trasformazioni per
quasi–normalita'.
• La Statistica T2 di Hotelling. Regioni di confidenza e intervalli
di confidenza simultanei per il vettore media di una distribuzione
normale multivariata. Il caso di grandi campioni.
• Confronto di coppie di trattamenti. Confronto di vettori di media
tra due popolazioni. Caso di uguale matrice di covarianza. Caso di
matrici di covarianza diverse. Confronto di medie di varie
popolazioni multivariate: test sul Λ di Wilks e test di
Bartlett.
• Separazione e classificazione per due popolazioni, con
valutazione della probabilita` a priori e dei costi.
Classificazione di due popolazioni normali multivariate con matrici
di covarianza uguali. La funzione di discriminazione di
Fisher.
• Modello classico di Regressione lineare multivariata. La Stima
col metodo dei minimi quadrati. Regione di confidenza per i
parametri di regressione. Valutazione del modello mediante i valori
stimati. Stime del valore atteso e previsione di una nuova
osservazione.
• Componenti Principali. Variabili standardizzate. Analisi della
variabilita' dei dati mediante l'uso delle componenti principali.
• Il modello fattoriale ortogonale. Il metodo dei fattori (o
componenti) principali per la stima dei pesi. Valutazione della
bonta' della stima. Rotazione dei fattori. Valutazione dei fattori.
Testi/Bibliografia
Applied Multivariate Statistical Analysis, R. A. Johnson e D. W. Wichern, Prentice Hall, V edizione, 2002
Metodi didattici
Lezioni in aula ed in laboratorio informatico.
Modalità di verifica e valutazione dell'apprendimento
La verifica dell'apprendimento avviene attraverso il solo esame finale, che accerta l'acquisizione delle conoscenze e delle abilità attese tramite lo svolgimento di una prova orale. La durata della prova orale è mediamente di 70-75 minuti ed è strutturata nel seguente modo:
- Trattazione di due argomenti svolti nel corso della parte teorica- Esercitazione in laboratorio informatico su argomenti svolti in laboratorio
Il voto finale viene calcolato come media aritmetica della votazione acquisita acquisita nell'esposizione degli argomenti teorici e del voto ottenuto nell'esercitazione.
Strumenti a supporto della didattica
1) Lezioni (ed esercizi) tenute alla
lavagna e con supporto del video-proiettore. Dispense.
2) Esercitazioni al calcolatore
Orario di ricevimento
Consulta il sito web di Cristina Puzzarini
Consulta il sito web di Massimo Marcaccio