- Docente: Anna Gloria Billè
- Crediti formativi: 6
- SSD: SECS-S/03
- Lingua di insegnamento: Italiano
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Bologna
- Corso: Laurea Magistrale in Direzione aziendale (cod. 0897)
Conoscenze e abilità da conseguire
Al termine del corso, lo studente conosce i modelli statistici che sono alla base dell'attività di estrazione di conoscenza da grandi quantità di dati (Big Data). In particolare, lo studente è in grado di: - strutturare un processo di data mining; - scegliere, tra gli strumenti metodologici, quelli più adeguati a raggiungere l'obiettivo in esame; - interpretare criticamente i risultati.
Contenuti
1. Introduzione ai Dati ed alla Statistica multivariata
1.1 Tipologie di dati e problemi
1.2 Obiettivi della statistica multivariata
1.3 Interpolazione dei dati mancanti nelle serie storiche
2. Analisi di Regressione Multivariata
2.1 Modelli di regressione lineare.
2.2 Effetti marginali e variabili dummy
2.3 Analisi dei Residui e Test di Specificazione
2.4 Violazioni delle ipotesi di Gauss-Markov
2.5 Stimatori Weighted Least Square e Two Stage Least
Square (2SLS);
3.3 Analisi Multivariata
3.1 Tecniche di selezione delle variabili: LASSO
3.2 Analisi Multivariata e Analisi delle Componenti
Principali.
4. Discriminazione e Classificazione
4.1 Modelli di regressione nonlineare nei parametri
4.2 Regressione logistica multinomiale
4.3 Modello di regressione probit spaziale
5. Clusterizzazione
5.1 Alberi di regressione
5.2 Clasterizzazione gerarchica
5.3 Clasterizzazione "K-means"
5.4 Clasterizzazione Spaziale
6. Introduzione alle Serie Storiche
6.1 Componenti delle serie storiche
6.2 Decomposizione delle serie storiche
6.3 Stima delle componenti
6.4 Metodi semplici di previsione
7. Modelli nonlineari, Power Transfromation and Panel Data.
7.1 Modelli nonlineari nei regressori
7.2 Power Trasformations of distributions
7.3 Panel Data
Testi/Bibliografia
Letture di approfondimento:
1) Tsai Chun-Wei et al. (2015), Big Data Analytics: a survey, Journal of Big Data, 2:21.
A supporto si consigliano i seguenti testi:
1) Daniel Zelterman (2014), Applied Multivariate Statistics with
R, Springer.
2) Marno Verbeek (2005), Econometria, I edizione, Zanichelli
Editore.
3) William Greene (2019), Econometric Analysis, Pearson. Eighth
Edition (Global Edition).
4) Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani (2021), An Introduction to Statistical Learning with Applications in R, Springer.
Metodi didattici
Le lezioni vengono svolte trattando sia aspetti teorici che pratici con l'ausilio del software statistico R.
I dati utilizzati sono disponibili nei pacchetti di R e sono per lo più di natura economico-aziendale.
Modalità di verifica e valutazione dell'apprendimento
Esame Orale
L'esame consisterà nella preparazione di una tesina di gruppo.
Gli studenti verranno divisi in gruppi e prepareranno una breve tesina spiegando il data set utilizzato, il metodo scelto e i principali risultati con l'utilizzo di R.
Ciascun gruppo preparerà inoltre una breve presentazione del lavoro con delle slide, durante la quale verranno fatte alcune domande orali.
Strumenti a supporto della didattica
Pc; videoproiettore; aula di laboratorio informatico.
Orario di ricevimento
Consulta il sito web di Anna Gloria Billè
SDGs


L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.