90591 - BIG DATA ANALYTICS

Anno Accademico 2023/2024

  • Docente: Anna Gloria Billè
  • Crediti formativi: 6
  • SSD: SECS-S/03
  • Lingua di insegnamento: Italiano
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Bologna
  • Corso: Laurea Magistrale in Direzione aziendale (cod. 0897)

Conoscenze e abilità da conseguire

Al termine del corso, lo studente conosce i modelli statistici che sono alla base dell'attività di estrazione di conoscenza da grandi quantità di dati (Big Data). In particolare, lo studente è in grado di: - strutturare un processo di data mining; - scegliere, tra gli strumenti metodologici, quelli più adeguati a raggiungere l'obiettivo in esame; - interpretare criticamente i risultati.

Contenuti

Introduzione ai dati: definizione, tipologie e fonti, peculiarità dei microdati, principali problemi con dati osservazionali.

Modelli lineari: intro, ipotesi di Gauss-Markov ed inferenza, effetti marginali, variabili dummy, modus operandi nella scelta del modello, LASSO, esempi su dati economici. Analisi dei residui e test di specificazione, violazione delle ipotesi e stimatori alternativi, test su endogeneità, test su esogeneità degli strumenti, esempio di endogeneità.

Serie storiche: intro, analisi dei residui e test di specificazione, componenti delle serie storiche, previsione con metodi classici, imputazione dei dati mancanti con metodi a media mobile.

Discriminazione, classificazione e clustering: intro, regressione logistica multinomiale, binary probit/logit models, spatial probit model, alberi di regressione, k-means clustering, clasterizzazione spaziale.

Further topics: modelli nonlineri nei regressori, trasformazioni di potenze delle distribuzioni, accenno ai dati panel.

Programmazione in R

Testi/Bibliografia

Testo di riferimento:
Marno Verbeek (2005), Econometria, I edizione, Zanichelli
Editore.

Materiale didattico predisposto dal docente sotto forma di
presentazioni pdf in virtuale.

Letture di approfondimento:
Tsai Chun-Wei et al. (2015), Big Data Analytics: a survey, Journal of Big Data, 2:21.

William Greene (2019), Econometric Analysis, Pearson. Eighth
Edition (Global Edition).

Daniel Zelterman (2014), Applied Multivariate Statistics with R, Springer.

Gareth James, Daniela Witten, Trevor Hastie, Robert
Tibshirani (2021), An Introduction to Statistical Learning with
Applications in R, Springer.

Nota: Qualsiasi libro di testo già in possesso dello studente che comprenda gli argomenti su elencati può essere preso in considerazione come alternativa al testo di riferimento e alle letture di approfondimento. Non c'è alcun obbligo nell'acquistare tali libri di testo. La lista dei riferimenti viene elencata per sottolineare le varie fonti (non esaustive) degli argomenti spiegati a lezione.

Metodi didattici

Le lezioni vengono svolte trattando sia aspetti metodologici che pratici con l'ausilio del software statistico R.

I dati utilizzati sono disponibili nei pacchetti di R o forniti dal docente e sono per lo più di natura economica.

 

Modalità di verifica e valutazione dell'apprendimento

Esame Orale

L'esame consisterà nella preparazione di una tesina di gruppo con presentazione del lavoro in sede di esame attraverso una presentazione power point. Ciascuno studente sarà sottoposto ad una/due domande che possono vertere sia sulla presentazione che sugli argomenti del corso in generale.

Gli studenti verranno divisi in gruppi (circa 6 persone per gruppo) e prepareranno una presentazione power point spiegando il data set utilizzato, il/i metodo/metodi scelto/i e i principali risultati con l'utilizzo di R. A lezione verrà spiegata la struttura della tesina da preparare.

Per gli studenti non frequentanti l'esame consisterà in un orale con domande su tutto il corso presentato.

Strumenti a supporto della didattica

Pc; videoproiettore.

Orario di ricevimento

Consulta il sito web di Anna Gloria Billè

SDGs

Istruzione di qualità Imprese innovazione e infrastrutture

L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.