00914 - STATISTICA

Anno Accademico 2023/2024

  • Docente: Meri Raggi
  • Crediti formativi: 10
  • SSD: SECS-S/01
  • Lingua di insegnamento: Italiano
  • Moduli: Meri Raggi (Modulo 1) Silvia De Nicolò (Modulo 2)
  • Modalità didattica: Convenzionale - Lezioni in presenza (Modulo 1) Convenzionale - Lezioni in presenza (Modulo 2)
  • Campus: Bologna
  • Corso: Laurea in Economia aziendale (cod. 8871)

Conoscenze e abilità da conseguire

Al termine del corso lo studente conosce gli strumenti di base del calcolo delle probabilità e le principali metodologie statistiche per l'’analisi dei dati, la stima e la previsione dei fenomeni di interesse osservati attraverso indagini campionarie. In particolare, lo studente è in grado di fornire una sintesi descrittiva dei dati per mezzo di indicatori sintetici e del modello di regressione lineare, anche attraverso l’'uso di software specifici, di risolvere semplici quesiti di calcolo delle probabilità e di stimare un parametro di interesse attraverso l'’impiego di tecniche inferenziali quali l’'intervallo di confidenza e la verifica delle ipotesi.

Contenuti

MODULO 1:

Natura dei caratteri e scale di misura. Unità statistiche, popolazione e campione (definizioni e notazioni).

Raccolta e sistemazione dei dati: come si costruisce una matrice di dati, successioni, distribuzioni di frequenza (discreta e per classi). Distribuzioni di frequenza: univariate assolute, relative, cumulate e retrocumulate; bivariate assolute, relative e relative condizionate.

Rappresentazioni grafiche per caratteri qualitativi e quantitativi: diagramma a barre, areale, cartesiano, di dispersione, per serie storiche, cartogramma, istogramma e box-plot.

Misure di posizione: minimo, massimo, moda, mediana, quantili, media aritmetica, media ponderata e troncata (definizioni per successioni, per distribuzioni di frequenza e per classi; proprietà)

Misure di diversità: eterogeneità (indice di Gini assoluto e relativo), variabilità (campo di variazione, scarto quadratico medio, varianza, devianza, scarto interquartile) e concentrazione (indice di concentrazione) (definizioni per successioni, per distribuzioni di frequenza e per classi; proprietà).

Misure di forma: asimmetria (confronto con indici di posizione, interpretazione istogramma e box-plot, indice di Skewness per successioni, per distribuzioni di frequenza e per classi).

Distribuzione normale: definizione, proprietà e uso delle tavole.

Misure di associazione: connessione/indipendenza statistica (indice chi-quadro: definizione e proprietà), dipendenza in media (indice eta-quadro: definizione e proprietà), concordanza e discordanza (covarianza: definizione e proprietà), e dipendenza lineare (correlazione lineare: definizione e proprietà).

Analisi di regressione lineare semplice: aspetti teorici, coefficienti di regressione, metodo dei minimi quadrati e proprietà. Legami tra forme di indipendenza/dipendenza.

Probabilità: definizione, spazio degli eventi, leggi, funzione di ripartizione e di probabilità, probabilità condizionata e indipendenza. Legge dei grandi numeri. Teorema di Bayes.

Variabili causali: discrete e continue (definizione e proprietà), funzione di probabilità, di densità e di ripartizione. Valore atteso e varianza di una variabile casuale. Teorema del limite centrale.

Distribuzione di Bernoulli, binomiale, ipergeometrica, uniforme (discreta e continua), di Poisson, t di Student, chi-quadro e F di Fisher (definizione, proprietà e usi).

Distribuzioni campionarie della media, di una proporzione e della varianza, della differenza tra due medie e tra due proporzioni.

Stimatore (definizione e proprietà). Stima puntuale e per intervallo di una media, di una proporzione, di una varianza; della differenza tra due medie, tra due proporzioni. Determinazione dell’ampiezza campionaria.

Verifica di ipotesi per una media (varianza nota, varianza non nota, piccoli campioni e grandi campioni), per una proporzione (solo grandi campioni) per una varianza. Test per confronto tra medie, proporzioni e varianze. Test di indipendenza statistica.

Inferenza sul modello di regressione lineare: stimatori puntuali, intervallo di confidenza e verifica di ipotesi per i coefficienti di regressione.

 

MODULO 2:

 Introduzione ad R. Nozioni base sui software R ed Rstudio, nozioni sul linguaggio R e la sua sintassi, nonché sugli oggetti base e loro struttura. Importazione dei dati, loro visualizzazione e pulizia, applicazione delle principali funzioni e grafici.

Analisi statistica con R. Applicazione dei metodi statistici visti nel modulo 1 su dati reali tramite R (sia metodi descrittivi che inferenziali).

Testi/Bibliografia

Lo studente deve conoscere gli argomenti dettagliati nel programma, può scegliere liberamente un testo universitario di statistica. Ad esempio può utilizzare:

Per il modulo 1:

Borra S., Di Ciaccio A. (2020). Statistica, metodologie per le scienze economiche e sociali, McGraw-Hill.

Levine D.M., Szabat K., Stephan D.F. (2018). Statistica, Pearson.

Piccolo D. (2010.) Statistica, Il Mulino.

Sullivan M., Zavarrone E. (2015). Fondamenti di statistica, Pearson.

Pacini B., Raggi M. (2009). Statistica per l'analisi operativa dei dati, Carocci Editore.

Per il modulo 2:

Leva F., Masci C., Paganoni A.M., Laboratorio di statistica con R, Pearson, 2016, Milano. ISBN 8891901520

 

Esercitazioni e testi di esami passati saranno disponibili nella piattaforma di e-learning VIRTUALE.

Metodi didattici

Lezioni ed esercitazioni in presenza.

Uso della piattaforma VIRTUALE di e-learning per valutare la propria preparazione.

Modalità di verifica e valutazione dell'apprendimento

L'esame di statistica è composto da due prove: prova scritta e prova orale.

Ogni prova scritta include: 3-4 esercizi+3-4 domande di teoria + un esercizio di commento ad alcuni output di R.

Durante la prova verrà consegnato un formulario che è l'unico materiale consultabile. Non sono ammessi appunti di altre tipologie. È consentito l'uso della calcolatrice. La prova ha una durata massima di 2 ore.

La prova orale è obbligatoria per chi nella prova scritta ha ottenuto un voto sufficiente, ma inferiore a 20 trentesimi.  Si svolge su tutti gli  argomenti del programma  ed è rivolta ad approfondire la verifica della conoscenza della teoria. Il punteggio ottenibile varia da -3 a +3 e si aggiungerà al voto dello scritto. La prova orale deve essere sostenuta nella stessa sessione di appello dello scritto.

Per la prova scritta lo studente può scegliere se affrontare 2 parziali o un'unica prova totale. 

 Per il voto totale del corso la parte relativa al primo modulo peserà l'80% mentre quella relativa al secondo modulo il 20%.

 

____________________________________________________

La valutazione finale seguirà la seguente griglia:

• Preparazione e capacità di analisi non sufficienti: respinto.

• Preparazione e capacità di analisi sufficienti, espresse in un linguaggio formalmente corretto: 18-22

• Preparazione adeguata, capacità di analisi sufficiente, anche se non particolarmente articolate, espresse in un linguaggio corretto: 23-26.

• Conoscenza approfondita dei temi affrontati nel corso, buone capacità di analisi e di critica, padronanza della terminologia specifica: 27-29.

• Conoscenza molto approfondita dei temi affrontati nel corso, capacità di analisi critica e di collegamento, padronanza della terminologia specifica: 30-30L.

Strumenti a supporto della didattica

E-learning con la piattaforma VIRTUALE  di supporto alla didattica.

Orario di ricevimento

Consulta il sito web di Meri Raggi

Consulta il sito web di Silvia De Nicolò

SDGs

Istruzione di qualità Ridurre le disuguaglianze

L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.