- Docente: Paolo Verme
- Crediti formativi: 8
- SSD: SECS-S/03
- Lingua di insegnamento: Italiano
- Moduli: Paolo Verme (Modulo 1) Andrea Guizzardi (Modulo 2)
- Modalità didattica: Convenzionale - Lezioni in presenza (Modulo 1) Convenzionale - Lezioni in presenza (Modulo 2)
- Campus: Bologna
- Corso: Laurea in Scienze statistiche (cod. 8873)
Conoscenze e abilità da conseguire
Il corso si propone di introdurre alla complessità della moderna organizzazione dei dati statistici, in particolare di quelli disponibili in Internet, sia in forma strutturata che destrutturata. Lobiettivo principale del corso consiste nella formazione di competenze statistiche in grado di coniugare i fondamenti irrinunciabili della misura e della metodologia statistica nel passaggio che porta alle sogle della analisi statistica dei fenomeni, che consiste nella valutazione, selezione e sintesi dei giacimenti di dati oggi disponibili con relativa facilità. Più in dettaglio, alla fine del corso lo studente avrà le competenze per: 1. Orientarsi, mediante ricerche finalizzate, nelle principali molteplici e disomogenee fonti di dati oggi disponibili. Sia per quanto riguarda le fonti ufficiali (Istat, Eurostat, OCSE, Banca Mondiale, ); sia per quanto attiene alle fonti non convenzionali (le statistiche di Google, FaceBook, Twitter, E-bay, trip-advisor, .) 2. Avere una conoscenza di base del principale linguaggio di interrogazione delle grandi banche dati cioè della logica e della sintassi del linguaggio SQL, con particolare attenzione alla capacità di affrontare i problemi connessi alla integrazione dei dati, con riferimento specifico ai problemi del matching, sia esatto che statistico mediante lutilizzo del linguaggio SQL 3. Definire un efficace strategia di estrazione e sintesi di dati da grandi banche dati (i cosiddetti Big-data), mediante lutilizzo delle più appropriate tecniche statistiche finalizzate a definire le basi di dati più appropriate per lanalisi statistica dei fenomeni.
Contenuti
I produttori di informazioni statistica e le basi di dati
La mappa delle fonti statistiche nazionali internazionali ufficiali e non ufficiali.
La qualità dei dati: Principali dimensioni e le fonti dell’errorre
I big data dal web, punti di forza e debolezza per l’analisi statistica dei fenomeni in tempo reale con alta risoluzione spazio-temporale.
La misura dei fenomeni complessi (indicatori compositi)
La mappa degli indicatori compositi per l’economia e la finanza: leading coincident e lagged
La costruzione di un indicatore composito: modello concettuale, misure delle variabili latenti che compongono il fenomeno di interesse, qualità dei dati, trattamento dei missing data enalisi preliminari, tecniche di standardizzazione.
Le tecniche statistiche di ponderazione (aggregazione) degli indicatori elementari. Metodi statistici (Analisi di Correlazione e Regressione, Analisi delle Componenti Principali, Data Envelopment Analysis), Modelli multi-attributo (Analytic Hierarchy Processes (AHP), Conjoint Analysis) Metodi partecipativi: (Budget Allocation, sondaggi di opinione).
La verifica dell’indicatore composito (uncertainty/sensitivity analysis, validity analysis e discrimination analysis.
Case Study: l’uso delle grandi banche dati pubbliche per l’analisi e la previsione della domanda e dell’offerta turistica.
Lo schema: obiettivi e ipotesi di ricerca, scelta del modello statistico-economico, raccolta dei dati, controllo della loro qualità, soluzione di problemi di integrazione tra fonti differenti e presenza dati mancanti, specificazione stima e verifica dei risultati, conclusioni.
Testi/Bibliografia
OECD (2008), Handbook on Constructing Composite Indicators METHODOLOGY AND USER GUIDE
https://knowledge4policy.ec.europa.eu/publication/handbook-constructing-composite-indicators-methodology-user-guide-0_en
Dispense e materiale del docente
Metodi didattici
Lezioni in aula e discussione di casi. Tutorials o sessioni in laboratorio per le applicazioni delle tecniche statistiche e/o la cattura e gestione delle grandi basi di dati.
Gli studenti che vogliono seguire i laboratori devono seguire i corsi sulla sicurezza [https://elearning-sicurezza.unibo.it/] in e-learning mode (modules 1 and 2 )
Modalità di verifica e valutazione dell'apprendimento
L'esame è scritto ed è composto da un elaborato di gruppo su un case study (30% del punteggio) e da una prova scritta (70% del punteggio) contenente sia domande teoriche che esercizi. Per ogni domanda è previsto un punteggio da 0 a 36. 6 punti per la mancata risposta. Il punteggio finale della prova scritta si ottiene come media dei voti.
Durante la prova non è consentito alcun materiale come libri di testo, appunti, supporti informatici.
Per sostenere l'esame è necessario pre-registrarsi su AlmaEsami
Coloro che non riescono ad iscriversi entro la data prevista, sono tenuti a segnalare tempestivamente (e comunque prima della chiusura ufficiale delle liste di iscrizione) il problema alla Segreteria. Il docente ha diritto di ammetterlo ugualmente agli esami.
La verbalizzazione può avvenire in assenza dello studente.
Orario di ricevimento
Consulta il sito web di Paolo Verme
Consulta il sito web di Andrea Guizzardi
SDGs
L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.