96542 - METODI STATISTICI E DATA MINING

Scheda insegnamento

Anno Accademico 2021/2022

Conoscenze e abilità da conseguire

Il corso si propone di introdurre i metodi di statistica descrittiva e inferenziale e i metodi e i modelli per estrarre informazioni rilevanti da grandi moli di dati. Lo studente, al termine dell'insegnamento conosce: la nozione di statistica descrittiva; le basi dell'inferenza statistica ed i test di significatività utilizzati nell'analisi della varianza e della regressione; il sistema di gestione delle basi dati (Data Base Management System); le principali tecniche di Data Mining e l’applicazione di metodi e modelli per estrarre informazioni rilevanti da grandi moli di dati; i principali strumenti informatici di analisi statistica e di data mining. Inoltre, è in grado di analizzare criticamente le principali fonti statistiche (nazionali, europee e mondiali) e le relative analisi strutturali del settore agricolo ed agroalimentare, oltre a costruire strumenti di data visualization.

Contenuti

1. Introduzione alla Statistica e al Data Mining (totale unità didattica: 2 ore)

 

2. Statistica descrittiva (totale unità didattica: 10 ore)

2.1 Analisi statistica univariata

2.1.1 Rappresentazione numerica e grafica delle distribuzioni

2.1.2 Valori medi, misure di variabilità e di concentrazione

2.1.3 Curve di densità, distribuzioni normali e normale standardizzata

2.2 Analisi statistica bivariata

2.2.1 Tabelle a doppia entrata

2.2.2 Diagrammi a dispersione, correlazione e regressione lineare semplice (cenni sulla regressione multipla)

 

3. Dall'analisi dei dati all'inferenza statistica (totale unità didattica: 10 ore)

3.1 Probabilità e campionamento

3.1.1 Regole generali della probabilità e variabili aleatorie

3.1.2 Campionamento e teorema del limite centrale

3.1.3 Intervalli di confidenza

3.1.4 Test di significatività

3.2 Inferenza sulle variabili

3.2.1 Inferenza per la media e per la proporzione di una popolazione

3.2.2 Confronto tra due medie

3.3 Inferenza sulle relazioni

3.3.1 Il test chi-quadrato

3.3.2 Confronto tra più di due medie: analisi della varianza ad una via

3.3.3 Inferenze sulla regressione

 

4. Data Mining (totale unità didattica: 18 ore)

4.1 Introduzione al Data Base

4.2 Introduzione al Data Mining

4.3 Regressione e Classificazione

4.4 Ricampionamento

4.5 Associazione, analisi delle componenti principali, raggruppamento

 

5. Esercitazioni pratiche applicative (totale unità 20 ore)

5.1 Gestione Base dati

5.2 Analisi statistiche con foglio elettronico

5.3 Applicazioni Data Mining

5.4 Realizzazione questionario e analisi

Orario di ricevimento

Consulta il sito web di Giuseppe Palladino