- Docente: Meri Raggi
- Crediti formativi: 10
- SSD: SECS-S/01
- Lingua di insegnamento: Italiano
- Moduli: Meri Raggi (Modulo 1) Silvia De Nicolò (Modulo 2)
- Modalità didattica: Convenzionale - Lezioni in presenza (Modulo 1) Convenzionale - Lezioni in presenza (Modulo 2)
- Campus: Bologna
- Corso: Laurea in Economia aziendale (cod. 8871)
-
Orario delle lezioni (Modulo 1)
dal 12/11/2024 al 17/12/2024
Conoscenze e abilità da conseguire
Al termine del corso lo studente conosce gli strumenti di base del calcolo delle probabilità e le principali metodologie statistiche per l'analisi dei dati, la stima e la previsione dei fenomeni di interesse osservati attraverso indagini campionarie. In particolare, lo studente è in grado di fornire una sintesi descrittiva dei dati per mezzo di indicatori sintetici e del modello di regressione lineare, anche attraverso l'uso di software specifici, di risolvere semplici quesiti di calcolo delle probabilità e di stimare un parametro di interesse attraverso l'impiego di tecniche inferenziali quali l'intervallo di confidenza e la verifica delle ipotesi.
Contenuti
MODULO 1:
Natura dei caratteri e scale di misura. Unità statistiche, popolazione e campione (definizioni e notazioni).
Raccolta e sistemazione dei dati: come si costruisce una matrice di dati, successioni, distribuzioni di frequenza (discreta e per classi). Distribuzioni di frequenza: univariate assolute, relative, cumulate e retrocumulate; bivariate assolute, relative e relative condizionate.
Rappresentazioni grafiche per caratteri qualitativi e quantitativi: diagramma a barre, areale, cartesiano, di dispersione, per serie storiche, cartogramma, istogramma e box-plot.
Misure di posizione: minimo, massimo, moda, mediana, quantili, media aritmetica, media ponderata e troncata (definizioni per successioni, per distribuzioni di frequenza e per classi; proprietà)
Misure di diversità: eterogeneità (indice di Gini assoluto e relativo), variabilità (campo di variazione, scarto quadratico medio, varianza, devianza, scarto interquartile) e concentrazione (indice di concentrazione) (definizioni per successioni, per distribuzioni di frequenza e per classi; proprietà).
Misure di forma: asimmetria (confronto con indici di posizione, interpretazione istogramma e box-plot, indice di Skewness per successioni, per distribuzioni di frequenza e per classi).
Distribuzione normale: definizione, proprietà e uso delle tavole.
Misure di associazione: connessione/indipendenza statistica (indice chi-quadro: definizione e proprietà), dipendenza in media (indice eta-quadro: definizione e proprietà), concordanza e discordanza (covarianza: definizione e proprietà), e dipendenza lineare (correlazione lineare: definizione e proprietà).
Analisi di regressione lineare semplice: aspetti teorici, coefficienti di regressione, metodo dei minimi quadrati e proprietà. Legami tra forme di indipendenza/dipendenza.
Probabilità: definizione, spazio degli eventi, leggi, funzione di ripartizione e di probabilità, probabilità condizionata e indipendenza. Legge dei grandi numeri. Teorema di Bayes.
Variabili causali: discrete e continue (definizione e proprietà), funzione di probabilità, di densità e di ripartizione. Valore atteso e varianza di una variabile casuale. Teorema del limite centrale.
Distribuzione di Bernoulli, binomiale, ipergeometrica, uniforme (discreta e continua), di Poisson, t di Student, chi-quadro e F di Fisher (definizione, proprietà e usi).
Distribuzioni campionarie della media, di una proporzione e della varianza, della differenza tra due medie e tra due proporzioni.
Stimatore (definizione e proprietà). Stima puntuale e per intervallo di una media, di una proporzione, di una varianza; della differenza tra due medie, tra due proporzioni. Determinazione dell’ampiezza campionaria.
Verifica di ipotesi per una media (varianza nota, varianza non nota, piccoli campioni e grandi campioni), per una proporzione (solo grandi campioni) per una varianza. Test per confronto tra medie, proporzioni e varianze. Test di indipendenza statistica.
Inferenza sul modello di regressione lineare: stimatori puntuali, intervallo di confidenza e verifica di ipotesi per i coefficienti di regressione.
MODULO 2:
Introduzione ad R. Nozioni base sul linguaggio R e la sua sintassi, nonché sugli oggetti base e loro struttura.
Nozione di base sul software BlueSky Statistics: Integrazione del codice R, importazione dei dati, loro visualizzazione e pulizia.
Analisi statistica con R e BlueSky Statistics. Applicazione dei metodi statistici visti nel modulo 1 su dati reali (sia metodi descrittivi che inferenziali):
- Tabelle di frequenza e statistiche descrittive,
- Rappresentazioni grafiche,
- Esplorazione teorica ed empirica delle principali distribuzioni probabilistiche,
- Associazione e modello di regressione lineare.
Software utilizzato scaricabile gratuitamente al seguente link: https://www.blueskystatistics.com/support
Testi/Bibliografia
Lo studente deve conoscere gli argomenti dettagliati nel programma, può scegliere liberamente un testo universitario di statistica. Ad esempio può utilizzare:
Per il modulo 1:
Borra S., Di Ciaccio A. (2020). Statistica, metodologie per le scienze economiche e sociali, McGraw-Hill.
Levine D.M., Szabat K., Stephan D.F. (2018). Statistica, Pearson.
Piccolo D. (2010.) Statistica, Il Mulino.
Sullivan M., Zavarrone E. (2015). Fondamenti di statistica, Pearson.
Pacini B., Raggi M. (2009). Statistica per l'analisi operativa dei dati, Carocci Editore.
Per il modulo 2:
Leva F., Masci C., Paganoni A.M., Laboratorio di statistica con R, Pearson, 2016, Milano. ISBN 8891901520
Esercitazioni e testi di esami passati saranno disponibili nella piattaforma di e-learning VIRTUALE.
Metodi didattici
Lezioni ed esercitazioni in presenza.
Uso della piattaforma VIRTUALE di e-learning per valutare la propria preparazione.
Modalità di verifica e valutazione dell'apprendimento
L'esame (totale) di statistica è composto da due prove: prova scritta e prova orale.
Ogni prova scritta include: 3-4 esercizi+3-4 domande di teoria (parte relativa al modulo 1) + due esercizi di commento ad alcuni output di R/BlueSky Statistics (parte relativa al modulo 2).
Durante la prova verrà consegnato un formulario che è l'unico materiale consultabile. Non sono ammessi appunti di altre tipologie. È consentito l'uso della calcolatrice. La prova ha una durata massima di 2.30 ore.
Le valutazione delle due parti relative a modulo 1 e modulo 2 sarà svolta separatamente e ad ogni parte verrà assegnato un voto separato. La prova risulterà insufficiente se otterrà un voto inferiore a 16 in uno dei due moduli (o entrambi).
La prova orale è obbligatoria per chi nella prova scritta relativa ad uno dei due moduli (o entrambi) ha ottenuto un voto sufficiente, ma inferiore a 20 trentesimi. La prova orale includerà gli argomenti del modulo che ha ottenuto il voto inferiore a 20 (un modulo o entrambi i moduli nella stessa prova orale).
Si svolge su tutti gli argomenti del programma ed è rivolta ad approfondire la verifica della conoscenza della teoria. Il punteggio ottenibile varia da -3 a +3 e si aggiungerà al voto dello scritto. La prova orale deve essere sostenuta nella stessa sessione di appello dello scritto.
Per la prova scritta lo studente può scegliere se affrontare 3 parziali o un'unica prova totale.
Per il voto totale del corso la parte relativa al primo modulo peserà l'80% mentre quella relativa al secondo modulo il 20%.
____________________________________________________
La valutazione finale seguirà la seguente griglia:• Preparazione e capacità di analisi non sufficienti: respinto.
• Preparazione e capacità di analisi sufficienti, espresse in un linguaggio formalmente corretto: 18-22
• Preparazione adeguata, capacità di analisi sufficiente, anche se non particolarmente articolate, espresse in un linguaggio corretto: 23-26.
• Conoscenza approfondita dei temi affrontati nel corso, buone capacità di analisi e di critica, padronanza della terminologia specifica: 27-29.
• Conoscenza molto approfondita dei temi affrontati nel corso, capacità di analisi critica e di collegamento, padronanza della terminologia specifica: 30-30L.
Strumenti a supporto della didattica
E-learning con la piattaforma VIRTUALE di supporto alla didattica.
Orario di ricevimento
Consulta il sito web di Meri Raggi
Consulta il sito web di Silvia De Nicolò
SDGs
L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.