87947 - STATISTICAL DATA ANALYSIS FOR APPLIED PHYSICS

Anno Accademico 2025/2026

  • Docente: Enrico Giampieri
  • Crediti formativi: 6
  • SSD: FIS/07
  • Lingua di insegnamento: Inglese
  • Moduli: Enrico Giampieri (Modulo 1) Claudia Sala (Modulo 2)
  • Modalità didattica: Convenzionale - Lezioni in presenza (Modulo 1) Convenzionale - Lezioni in presenza (Modulo 2)
  • Campus: Bologna
  • Corso: Laurea Magistrale in Physics (cod. 6695)

Conoscenze e abilità da conseguire

At the end of the course the student will be acquainted with the main statistical concepts used in Physics. After a review of the fundamentals of probability theory, parametric inferential statistics will be introduced, from point estimates and confidence intervals to hypothesis testing and goodness-of-fit. Each item will be addressed both in the Bayesian and frequentist approaches. Dedicated practical sessions will allow the student to become familiar with these conceptual tools by studying applications in Applied Physics.

Contenuti

Modulo 1Fondamenti di teoria della probabilità e statistica; introduzione all’uso di R per l’analisi statistica (tenuto da E. Giampieri)
Modulo 2Test delle ipotesi; modelli lineari (base, generalizzati, additivi, penalizzati) (tenuto da C. Sala)

Programma – Modulo 1

  • Introduzione a R

  • Gestione dei dati tabulari; operazioni fondamentali

  • Concetto di probabilità: definizione assiomatica, combinatoriale, frequentista e soggettivista. Probabilità condizionata. Indipendenza statistica. Teorema di Bayes. Principio di indifferenza e paradosso di Bertrand.

  • Variabili aleatorie e densità di probabilità. Distribuzioni multivariate. Densità marginali e condizionali. Funzioni di variabili aleatorie.

  • Statistiche descrittive: valore d’aspettazione, varianza, covarianza, mediana, quantili, moda.

  • Esempi di distribuzioni: binomiale, multinomiale, Poisson, esponenziale, normale, normale multivariata, chi-quadrato, Breit-Wigner, Landau.

  • Teorema del limite centrale, legge dei grandi numeri.

  • Metodo Monte Carlo: criteri di convergenza, stima di integrali e relative incertezze, riduzione della varianza.

  • Propagazione degli errori – concetti teorici e simulazioni; dati sintetici.

  • Stima dei parametri: concetti fondamentali, approcci bayesiani e frequentisti.

  • Test statistici: introduzione; falsi positivi e negativi; fallacie assortite; approcci bayesiani e frequentisti. Concetto di priore, priori di Jeffreys, utility theory.

Programma – Modulo 2

  • Test di ipotesi. Test t di Student. Test F di Fisher.

  • P-value. Significatività statistica e potenza.

  • Correlazione. Regressione lineare. OLS. MLE.

  • Analisi della varianza (ANOVA).

  • Modelli lineari generalizzati. Regressione logistica.

  • Regressione lineare multivariata. Multicollinearità. Penalizzazioni Lasso, Ridge, Elastic-net.

  • Analisi di sopravvivenza. Test log-rank. Curva di Kaplan–Meier. Modello di Cox.

  • Modelli additivi generalizzati (GAM).

Testi/Bibliografia

Modulo 1

  • Glen Cowan, Statistical Data Analysis, Oxford University Press, 1998

  • (Opzionale, per maggiore approfondimento statistico) Trevor Hastie et al., The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Vol. 2, Springer, 2009

Modulo 2

  • John Maindonald e W. John Braun, Data Analysis and Graphics Using R – An Example-Based Approach, Cambridge University Press, 2003

  • Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani, An Introduction to Statistical Learning with Applications in R, Springer, 2013

  • Simon N. Wood, Generalized Additive Models – An Introduction with R, Chapman and Hall/CRC, 2017

Metodi didattici

Lezioni frontali in cui verranno discussi elementi di teoria, accompagnate da esercizi di gruppo (peer learning) per coadiuvare l’apprendimento.

Modalità di verifica e valutazione dell'apprendimento

L’esame sarà sostenuto congiuntamente dai docenti dei due moduli, e potrà essere svolto secondo due modalità alternative:

  1. Esame orale: domande di comprensione teorica e analisi critica di studi statistici tratti dalla letteratura.

  2. Progetto: concordato con i docenti, su uno dei topic proposti; prevede l’analisi di un dataset per rispondere a specifiche domande di ricerca, con la redazione di un report dettagliato degli approcci e dei risultati ottenuti (corredato dal codice utilizzato).

Studenti/esse con DSA o disabilità temporanee o permanenti: si raccomanda di contattare tempestivamente l’ufficio di Ateneo competente https://site.unibo.it/studenti-con-disabilita-e-dsa/it . Sarà sua cura proporre eventuali adattamenti, da sottoporre almeno 15 giorni prima alla valutazione e approvazione del docente, in relazione agli obiettivi formativi del corso.

Strumenti a supporto della didattica

Le slide presentate a lezione saranno disponibili sul sito GitHub del corso.

Orario di ricevimento

Consulta il sito web di Enrico Giampieri

Consulta il sito web di Claudia Sala