- Docente: Marilena Pillati
- Crediti formativi: 5
- SSD: SECS-S/01
- Lingua di insegnamento: Italiano
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Bologna
- Corso: Laurea in Scienze statistiche (cod. 8054)
Conoscenze e abilità da conseguire
Al termine del corso lo studente conosce i fondamenti metodologici di alcune delle principali tecniche statistiche per l'analisi di matrici di dati. In particolare lo studente è in grado di: - utilizzare i metodi classici di riduzione delle dimensioni - riconoscere gruppi di unità non noti a priori - affrontare il problema della classificazione - interpretare criticamente l'output di alcune procedure di R per l'analisi multidimensionale dei dati
Contenuti
Analisi delle componenti principali - Interpretazione
geometrica. Sviluppi formali. Regressione in componenti
principali.
Analisi fattoriale - Il modello fattoriale classico:
definizione, identificazione e stima. Analisi in componenti
principali e analisi fattoriale a confronto.
Analisi dei gruppi - Misure di distanza e di
dissomiglianza tra unità. Metodi di classificazione gerarchici.
Metodi di classificazione partitivi.
Analisi discriminante - Regole di classificazione basate su modelli probabilistici: criterio della minimizzazione della probabilità totale di una errata classificazione, criterio del rapporto di verosimiglianze. Regola di classificazione lineare di Fisher. Metodi per la stima del tasso di errata classificazione.
Testi/Bibliografia
S. Mignani, A. Montanari, Appunti di analisi statistica multivariata, Esculapio, Bologna, 1994.
W.J. Krzanowski, Principles of Multivariate Analysis: A User's Perspective, 1988, Oxford University Press.
Metodi didattici
Lezioni teoriche in aula, nel corso delle quali saranno illustrate gli aspetti metodologici delle diverse tecniche, ed esercitazioni in laboratorio, durante le quali verranno presentati e discussi esempi di analisi di dati reali realizzati con R
Modalità di verifica e valutazione dell'apprendimento
L'esame mira a verificare il raggiungimento dei seguenti
obiettivi formativi:
- conoscenza dei metodi di analisi multivariata trattati nel corso
- applicazione dei metodi all'analisi di matrici di dati
L'esame è scritto e orale e la valutazione è espressa in
trentesimi.
La valutazione del Corso Integrato "Campionamento e Analisi dei
dati" è data dalla media delle valutazioni dei due moduli.
Strumenti a supporto della didattica
Orario di ricevimento
Consulta il sito web di Marilena Pillati