- Docente: Michele Scagliarini
- Crediti formativi: 8
- SSD: SECS-S/01
- Lingua di insegnamento: Italiano
- Moduli: Michele Scagliarini (Modulo 1) Angela Montanari (Modulo 2) Laura Guidotti (Modulo 3)
- Modalità didattica: Convenzionale - Lezioni in presenza (Modulo 1) Convenzionale - Lezioni in presenza (Modulo 2) Convenzionale - Lezioni in presenza (Modulo 3)
- Campus: Bologna
- Corso: Laurea in Scienze statistiche (cod. 8873)
Conoscenze e abilità da conseguire
Al termine del corso lo studente conosce i fondamenti metodologici di alcune delle principali tecniche statistiche per l'analisi di matrici di dati e gli aspetti fondamentali dell'inferenza statistica in popolazioni finite e dei metodi di campionamento statistico. In particolare lo studente è in grado di: - utilizzare i metodi classici di riduzione delle dimensioni - riconoscere gruppi di unità non noti a priori - affrontare il problema della classificazione - interpretare criticamente l'output di alcune procedure di R per l'analisi multidimensionale dei dati - proporre i principali piani di campionamento alternativi al campionamento casuale semplice e valutarne le proprietà
Contenuti
Modulo 1: Metodi di Campionamento
Docente: Michele Scagliarini
L'inferenza in popolazioni infinite e in popolazioni finite.
L'inferenza basata sul piano di campionamento.
Il campionamento casuale semplice con e senza reintroduzione.
Il campionamento a probabilità variabile: lo stimatore di Horvitz Thompson e lo stimatore di Hansen Hurwitz.
L'impiego di variabili ausiliarie: stimatori per quoziente e per regressione.
Stratificazione e grappolatura.
Modulo 2: Analisi dei dati
Docente: Angela Montanari
Analisi delle componenti principali - Interpretazione geometrica. Sviluppi formali. Regressione in componenti principali.
Analisi fattoriale - Il modello fattoriale classico: definizione, identificazione e stima. Analisi in componenti principali e analisi fattoriale a confronto.
Analisi dei gruppi - Misure di distanza e di dissomiglianza tra unità. Metodi di classificazione gerarchici. Metodi di classificazione partitivi.
Analisi discriminante - Regole di classificazione basate su modelli probabilistici: criterio della minimizzazione della probabilità totale di una errata classificazione, criterio del rapporto di verosimiglianze. Regola di classificazione lineare di Fisher. Metodi per la stima del tasso di errata classificazione.
Modulo 3: Complementi di Algebra Lineare
Docente: Laura Guidotti
Forme quadratiche reali e matrici simmetriche – Proprietà, segno di una forma quadratica reale. Criteri di classificazione. Legge di inerzia di Sylvester.
Massimo e minimo di una forma quadratica reale sulla sfera unitaria.
Scomposizione in valori singolari di una matrice (SVD) – Costruzione e proprietà della SVD. Applicazione della SVD nella ricerca della soluzione ai minimi quadrati di un sistema lineare. Pseudo-inversa di Moore-Penrose di una matrice.
Testi/Bibliografia
Modulo 1: Metodi di Campionamento
Dispensa scaricabile dal web: Daniela Cocchi "Teoria dei Campioni (corso base)".
Ulteriore materiale didattico sarà fornito dal docente durante le lezioni.
Modulo 2: Analisi dei dati
S. Mignani, A. Montanari, Appunti di analisi statistica multivariata, Esculapio, Bologna, 1994.
W.J. Krzanowski, Principles of Multivariate Analysis: A User's Perspective, 1988, Oxford University Press.
Modulo 3: Complementi di Algebra Lineare
Dispensa sul sito della docente.
E. Schlesinger, Algebra Lineare e Geometria, Zanichelli, 2013.
L. Mauri, E.Schlesinger, Esercizi di Algebra Lineare e Geometria, Zanichelli, 2013.
C.D. Meyer, Matrix Analysis and Applied Linear Algebra, SIAM, 2000.
Metodi didattici
Modulo 1: Metodi di Campionamento
Lezioni frontali ed esercitazioni
Modulo 2: Analisi dei dati
Lezioni teoriche in aula, nel corso delle quali saranno illustrate gli aspetti metodologici delle diverse tecniche, ed esercitazioni in laboratorio, durante le quali verranno presentati e discussi esempi di analisi di dati reali realizzati con R
Modulo 3: Complementi di algebra lineare
Lezioni frontali
Modalità di verifica e valutazione dell'apprendimento
L'esame mira a verificare il raggiungimento dei seguenti obiettivi didattici:
- conoscenza degli aspetti fondamentali del campionamento da popolazioni finite
- la capacità di utilizzare le conoscenze acquisite per progettare piani di campionamento
- conoscenza delle basi algebriche per la statistica multivariata
- conoscenza dei metodi di analisi multivariata trattati nel corso
- applicazione dei metodi all'analisi di matrici di dati
L'esame è scritto e orale e la valutazione è espressa in trentesimi.
La valutazione del Corso "Campionamento e analisi dei dati" è data dalla media delle valutazioni dei due moduli. La verifica della conoscenza degli argomenti del modulo di "Complementi di algebra lineare" verrà svolta nell’ ambito dell’ esame orale di Analisi dei dati.
Strumenti a supporto della didattica
Lucidi delle lezioni.
Link ad altre eventuali informazioni
http://www.unibo.it/docenti/michele.scagliarini
Orario di ricevimento
Consulta il sito web di Michele Scagliarini
Consulta il sito web di Angela Montanari
Consulta il sito web di Laura Guidotti