96542 - METODI STATISTICI E DATA MINING

Anno Accademico 2022/2023

  • Docente: Giuseppe Palladino
  • Crediti formativi: 6
  • SSD: SECS-S/01
  • Lingua di insegnamento: Italiano
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Bologna
  • Corso: Laurea in Economia e marketing nel sistema agro-industriale (cod. 5833)

Conoscenze e abilità da conseguire

Il corso si propone di introdurre i metodi di statistica descrittiva e inferenziale e i metodi e i modelli per estrarre informazioni rilevanti da grandi moli di dati. Lo studente, al termine dell'insegnamento conosce: la nozione di statistica descrittiva; le basi dell'inferenza statistica ed i test di significatività utilizzati nell'analisi della varianza e della regressione; il sistema di gestione delle basi dati (Data Base Management System); le principali tecniche di Data Mining e l’applicazione di metodi e modelli per estrarre informazioni rilevanti da grandi moli di dati; i principali strumenti informatici di analisi statistica e di data mining. Inoltre, è in grado di analizzare criticamente le principali fonti statistiche (nazionali, europee e mondiali) e le relative analisi strutturali del settore agricolo ed agroalimentare, oltre a costruire strumenti di data visualization.

Contenuti

1. Introduzione alla Statistica e al Data Mining (totale unità didattica: 2 ore)

 

2. Statistica descrittiva (totale unità didattica: 10 ore)

2.1 Analisi statistica univariata

2.1.1 Rappresentazione numerica e grafica delle distribuzioni

2.1.2 Valori medi, misure di variabilità e di concentrazione

2.1.3 Curve di densità, distribuzioni normali e normale standardizzata

2.2 Analisi statistica bivariata

2.2.1 Tabelle a doppia entrata

2.2.2 Diagrammi a dispersione, correlazione e regressione lineare semplice (cenni sulla regressione multipla)

 

3. Dall'analisi dei dati all'inferenza statistica (totale unità didattica: 10 ore)

3.1 Probabilità e campionamento

3.1.1 Regole generali della probabilità e variabili aleatorie

3.1.2 Campionamento e teorema del limite centrale

3.1.3 Intervalli di confidenza

3.1.4 Test di significatività

3.2 Inferenza sulle variabili

3.2.1 Inferenza per la media e per la proporzione di una popolazione

3.2.2 Confronto tra due medie

3.3 Inferenza sulle relazioni

3.3.1 Il test chi-quadrato

3.3.2 Confronto tra più di due medie: analisi della varianza ad una via

3.3.3 Inferenze sulla regressione

 

4. Data Mining (totale unità didattica: 18 ore)

4.1 Introduzione al Data Base

4.2 Introduzione al Data Mining

4.3 Regressione e Classificazione

4.4 Ricampionamento

4.5 Associazione, analisi delle componenti principali, raggruppamento

 

5. Esercitazioni pratiche applicative (totale unità 20 ore)

5.1 Gestione Base dati

5.2 Analisi statistiche con foglio elettronico

5.3 Applicazioni Data Mining

5.4 Realizzazione questionario e analisi

Testi/Bibliografia

Fulvia Mecatti, “ Statistica di base. Come, quando, perché", McGrawHill

Dispense e materiale messo a disposizione dal docente.

Materiale didattico specifico, in formato elettronico.

Metodi didattici

Il corso si suddivide in 4 unità didattiche, per ciascuna di esse è prevista:

- una componente teorica;

- una componente pratico/applicativa.

Per ogni singolo argomento trattato, il docente dopo aver rappresentato la componente teorica, introduce le modalità applicative degli strumenti di analisi.

Lo studente partecipa alla lezione con il supporto di un PC portatile.

Modalità di verifica e valutazione dell'apprendimento

La verifica dell'apprendimento avviene in due modalità:

1) la prima è costituita da una prova tecnico pratica tesa a verificare il livello delle conoscenze acquisite. Questa modalità è riservata agli studenti che operano in gruppi di lavoro strutturati nel corso delle lezioni. Il lavoro consiste nello svolgimento di un business case mediante l’applicazione di analisi di tipo quantitativo.

2) la seconda avviene tramite una prova individuale scritta mediante l’esecuzione di un Test a risposte multiple e di esercizi.

Entrambe le modalità tendono ad accertare, non solo le competenze acquisite nelle unità didattiche, ma anche il raggiungimento di una visione organica degli argomenti sviluppati nelle lezioni.


Strumenti a supporto della didattica

1) Suite MS Office messa a disposizione dall'Università.

2) MS Forms: software utilizzato per la realizzazione dei questionari;

3) Tutorial realizzati dal docente;

4) Basi di dati ISTAT, EUROSTAT e FAOSTAT.

Orario di ricevimento

Consulta il sito web di Giuseppe Palladino