11396 - ANALISI STATISTICA MULTIVARIATA

Anno Accademico 2014/2015

  • Docente: Cristina Puzzarini
  • Crediti formativi: 6
  • SSD: MAT/06
  • Lingua di insegnamento: Italiano
  • Moduli: Cristina Puzzarini (Modulo 1) Massimo Marcaccio (Modulo 2)
  • Modalità didattica: Convenzionale - Lezioni in presenza (Modulo 1) Convenzionale - Lezioni in presenza (Modulo 2)
  • Campus: Ravenna
  • Corso: Laurea Magistrale in Analisi e gestione dell'ambiente (cod. 8418)

Conoscenze e abilità da conseguire

Al termine del corso, lo studente possiede una conoscenza dell'Analisi Statistica Multivariata per il trattamento dei dati. E' in grado di utilizzare gli strumenti delle Distribuzioni normali multivariate, l'Analisi Multipla della Varianza, l'Analisi delle Componenti Principali e Fattoriale.

Contenuti

• L'organizzazione dei dati. Statistica descrittiva multivariata.
• Misure di dissimilarita' (distanze). Misure di similarita' e associazione. Analisi di Clusters con metodi di aggregazione.
• Multidimensional scaling classico.
• Vettori e Matrici Casuali. Vettore media e Matrice di Varianza/Covarianza. Combinazioni lineari di vettori casuali e loro media e varianza. Campioni casuali e valori attesi per il vettore media e la Matrice di Covarianza campionarie. Varianza Generalizzata e Varianza totale campionarie.
• La distribuzione normale multivariata. Funzione di densita' e proprieta' fondamentali. La distribuzione campionaria della media e della matrice di covarianza. Comportamento per grandi campioni. Test sull'ipotesi di normalita'. Trasformazioni per quasi–normalita'.
• La Statistica T2 di Hotelling. Regioni di confidenza e intervalli di confidenza simultanei per il vettore media di una distribuzione normale multivariata. Il caso di grandi campioni.
• Confronto di coppie di trattamenti. Confronto di vettori di media tra due popolazioni. Caso di uguale matrice di covarianza. Caso di matrici di covarianza diverse. Confronto di medie di varie popolazioni multivariate: test sul Λ di Wilks e test di Bartlett.
• Separazione e classificazione per due popolazioni, con valutazione della probabilita` a priori e  dei costi. Classificazione di due popolazioni normali multivariate con matrici di covarianza uguali. La funzione di discriminazione di Fisher.
• Modello classico di Regressione lineare multivariata. La Stima col metodo dei minimi quadrati. Regione di confidenza per i parametri di regressione. Valutazione del modello mediante i valori stimati. Stime del valore atteso e previsione di una nuova osservazione.
• Componenti Principali. Variabili standardizzate. Analisi della variabilita' dei dati mediante l'uso delle componenti principali.
• Il modello fattoriale ortogonale. Il metodo dei fattori (o componenti) principali per la stima dei pesi. Valutazione della bonta' della stima. Rotazione dei fattori. Valutazione dei fattori.

Testi/Bibliografia

Applied Multivariate Statistical Analysis, R. A. Johnson e D. W. Wichern, Prentice Hall, V edizione, 2002

Metodi didattici

Lezioni in aula ed in laboratorio informatico.

Modalità di verifica e valutazione dell'apprendimento

La verifica dell'apprendimento avviene attraverso il solo esame finale, che accerta l'acquisizione delle conoscenze e delle abilità attese tramite lo svolgimento di una prova orale. La durata della prova orale è mediamente di 70-75 minuti ed è strutturata nel seguente modo:

-       Trattazione di due argomenti svolti nel corso della parte teorica

-       Esercitazione in laboratorio informatico su argomenti svolti in laboratorio

Il voto finale viene calcolato come media aritmetica della votazione acquisita acquisita nell'esposizione degli argomenti teorici e del voto ottenuto nell'esercitazione.

Strumenti a supporto della didattica

1) Lezioni (ed esercizi) tenute alla lavagna e con supporto del video-proiettore. Dispense.
2) Esercitazioni al calcolatore

Orario di ricevimento

Consulta il sito web di Cristina Puzzarini

Consulta il sito web di Massimo Marcaccio