90591 - BIG DATA ANALYTICS

Anno Accademico 2021/2022

  • Docente: Anna Gloria Billè
  • Crediti formativi: 6
  • SSD: SECS-S/03
  • Lingua di insegnamento: Italiano
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Bologna
  • Corso: Laurea Magistrale in Direzione aziendale (cod. 0897)

Conoscenze e abilità da conseguire

Al termine del corso, lo studente conosce i modelli statistici che sono alla base dell'attività di estrazione di conoscenza da grandi quantità di dati (Big Data). In particolare, lo studente è in grado di: - strutturare un processo di data mining; - scegliere, tra gli strumenti metodologici, quelli più adeguati a raggiungere l'obiettivo in esame; - interpretare criticamente i risultati.

Contenuti

1. Introduzione ai Dati ed alla Statistica multivariata

1.1 Tipologie di dati e problemi

1.2 Obiettivi della statistica multivariata

2. Definizione di Distribuzioni Normali Multivariate 

2.1 Inferenza sulla media di un vettore multivariato

2.2 Inferenza sulla Covarianza di un vettore multivariato

3. Analisi di Regressione Multivariata

3.1 Regressioni Lineari: Un richiamo

3.2 Analisi dei Residui e Test di Specificazione del modello

3.3 Analisi Multivariata e Componenti Principali sui residui di regressione

4. Discriminazione e Classificazione

4.1 Modelli di regressione nonlineare nei parametri

4.2 Regressione logistica multinomiale

4.3 Modello di regressione probit spaziale

5. Clusterizzazione

5.1 Alberi di regressione

5.2 Clasterizzazione gerarchica

5.3 Clasterizzazione "K-means"

5.4 Clasterizzazione Spaziale

6. Introduzione alle Serie Storiche

6.1 Componenti delle serie storiche 

6.2 Decomposizione delle serie storiche 

6.3 Stima delle componenti

6.4 Metodi semplici di previsione

Testi/Bibliografia

A supporto si consigliano i seguenti testi:

Daniel Zelterman (2014), Applied Multivariate Statistics with
R, Springer.

Marno Verbeek (2005), Econometria, I edizione, Zanichelli
Editore.

William Greene (2019), Econometric Analysis, Pearson. Eighth
Edition (Global Edition).

Metodi didattici

Le lezioni vengono svolte trattando sia aspetti teorici che pratici con l'ausilio del software statistico R.

I dati utilizzati sono disponibili nei pacchetti di R e sono per lo più di natura economico-aziendale.

 

Modalità di verifica e valutazione dell'apprendimento

Esame Orale

L'esame consisterà nella preparazione di una tesina di gruppo. 

Gli studenti verranno divisi in gruppi e prepareranno una breve tesina spiegando il data set utilizzato, il metodo scelto e i principali risultati con l'utilizzo di R.

Ciascun gruppo preparerà inoltre una breve presentazione del lavoro con delle slide, durante la quale verranno fatte alcune domande orali.

Strumenti a supporto della didattica

Pc; videoproiettore; aula di laboratorio informatico.

Orario di ricevimento

Consulta il sito web di Anna Gloria Billè

SDGs

Istruzione di qualità Imprese innovazione e infrastrutture

L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.