[2017/2018] Analisi statistica ... Programma Modulo 3
Analisi Statistica dei Dati nella Fisica Nucleare e Subnucleare
Modulo 3 - Laboratorio
docente: Gabriele Sirri
Anno Accademico 2017/2018
Durante le lezioni sono previste sessioni di esercizi che richiedono la scrittura e l'esecuzione di software basato sul pacchetto ROOT . E' pertanto consigliato l'utilizzo di un proprio computer portatile.
IMPORTANTE: verificate i requisiti per l'utilizzo di ROOT su un portatile personale.
Materiale del corso (slides, testo esercizi e soluzioni) sarà
pubblicato dopo la lezione in: http://campus.unibo.it/295300/
Soluzioni degli esercizi: saranno pubblicate su AMS Campus
e accessibili agli iscritti alla lista docenti-studenti
GABRIELE.SIRRI2.ASD-2017-LAB
_____________________________________________________
Lezione 0
2017.09.28, ore 11-12. Aula C
Introduzione al corso.
Durante questa lezione introduttiva sono mostrati il programma e il calendario del corso. Sono forniti chiarimenti sulle modalità di verifica dell'apprendimento. Sono date indicazioni sullo svolgimento delle esercitazioni di laboratorio.
ROOT.
Sono mostrate una selezione di slide riassuntive sul framework ROOT (http://root.cern.ch) .
materiale: http://campus.unibo.it/295300/
- slides - introduzione
- slides - ROOT Tutorial (mostrate)
HOMEWORK:
0) iscriversi alla alla lista docenti-studenti GABRIELE.SIRRI2.ASD-2017-LAB
1) Leggere con cura i capitoli “Introduction”, “Conceptual blocks for modeling” di Practical Statistics for the LHC di K. Cranmer (https://arxiv.org/abs/1503.07622)
2) Riprendere in mano i concetti base del C++, in particolare : namespace, classi, classe base e classi derivate, puntatori, reference, passaggio di argomenti by value e by reference, ... Se volete una guida sicura e moderna andate direttamente su http://isocpp.org (A Tour of C++).
3) Esercitarsi con il ROOT PRIMER (almeno fino al paragrafo 3.1) (https://root.cern.ch/root/htmldoc/guides/primer/ROOTPrimer.pdf)
_____________________________________________________
Lezione 1:
2017.10.19, ore 11-14. Aula C
Elementi concettuali della Modellazione
Sono mostrati gli elementi fondamentali della modellazione di un esperimento di fisica delle particelle: ensamble, canale, evento, osservabili, parametri, p.d.f., famiglie di pdf parametriche (il modello), numero atteso di eventi, Marked Poisson model, Likelihood, Likelihood come estimatore, Negative Log Likelihood, Likelihood del Marked Poisson model (likelihood estesa).
Rif. bibliografico: Practical Statistics for the LHC [https://arxiv.org/abs/1503.07622] di K. Cranmer (https://arxiv.org/abs/1503.07622)
Modellazione con RooFit.
Sono state mostrate le funzionalità di RooFit per costruire modelli semplici. Sono state introdotte le classi per definire variabili (RooRealVar), PDFs (RooAbsPdf e le derivate RooGaussian, RooExponential, RooPoisson, RooUniform, RooPolynomial, ... ) e dati (RooAbsData e le derivate RooDataSet, RooDataHist). Differenza tra binned e unbinned dataset. Funzionalità di visualizzazione di RooFit per la visualizzazione di pdf, la generazione di dati (binned e unbinned) tramite toy monte-carlo, la visualizzione di dati, il fit del modello ai dati.
materiale: http://campus.unibo.it/295300/
- slides - corso da 1 a 37
HOMEWORK:
- Tutorial 1 (http://campus.unibo.it/295300/ )
_____________________________________________________
Lezione 2: RooFit Workspace
2017.11.09, ore 11-13 Aula C
E' introdotto il RooWorkspace e la sintassi della Factory: per creare variabili, pdf e funzioni (!) utilizzando anche espressioni.
Modelli Composti: è mostrata la sintassi per costruire con RooFit un modello in cui si sommano 2 o piu' pdf (es. segnale + fondo) utilizzando come coefficienti sia "frazioni" sia "numero atteso di eventi". In questo secondo caso la likelihood utilizza i termini Poissoniani o estesi (likelihood di un marked poisson model).
Rif. bibliografico: manuale di RooFit, per il workspace e la factory slide del corso.
materiale: http://campus.unibo.it/295300/
- slides - corso da 38 a 52
HOMEWORK:
- Tutorial 2 (http://campus.unibo.it/295300/ )
_____________________________________________________
Lezione 3: Minuit. Likelihood interval. Profile likelihood ratio.
2017.11.16, ore 11-14. Aula C
Sono discusse le soluzioni dei tutorial1 e tutorial2. Sono confrontati esercizio 4 (ROOT) e esercizio 6 (RooFit). Sono discusse le principali differenze tra interpolazione fatta con ROOT e interpolazione fatta con RooFit (utilizzando entrambi i framework nelle loro impostazioni di default).
materiale: http://campus.unibo.it/295300/
- slides - discussione tutorial 1
- slides - discussione tutorial 2
Sono mostrate slide riguardanti i seguenti argomenti: Likelihood interval. Introduzione e utilizzo degli algoritmi di Minuit: MIGRAD, HESSE, MINOS e CONTOUR. Relazione tra RooAbsPdf::fitTo(...) e Minuit. Output di Minuit. Instabilità e correlazione tra parametri. Manipolazione diretta di Likelihood tramite RooFit: minimizzazione della neg log likelihood tramite RooMinuit (migrad, hesse, minos, contour) . Countour plot. NUISANCE PARAMETERS. PROFILE LIKELIHOOD RATIO. Equivalenza tra MINOS e Profile Likelihood Ratio.
materiale: http://campus.unibo.it/295300/
- slides - corso da 52 a 88
HOMEWORK:
- Tutorial 3 (http://campus.unibo.it/295300/ )
_____________________________________________________
Lezione 4: TMVA
2017.12.07, ore 11-14. Aula C
Sono discusse le soluzioni dei tutorial 2 e 3; in particolare l'equivalenza tra l'intervallo costruito con la profile likelihood e l'intervallo ottenuto gli algoritmi minos/contour di Minuit.
materiale: http://campus.unibo.it/295300/
- slides - discussione tutorial 2
- slides - discussione tutorial 3
Sono mostrate slide riguardanti TMVA: l'utilizzo di TMVA come classificatore, Boost Decision Tree, Multi-Layer Perceptron, Discriminante di Fisher; curva ROC, definizione di efficienza, purezza dei campioni selezionati. Si è discusso su come effettuare l'ottimizzazione dei tagli per massimizzare il risultato di un esperimento.
materiale: http://campus.unibo.it/295300/
- slides TMVA (Parte 1)
- slides TMVA (Parte 2)
HOMEWORK:
- Tutorial 4 (http://campus.unibo.it/295300/ )
_____________________________________________________
Lezione 5: Problema On/Off. RooStats.
2017.12.14, ore 11-14. ore 11-14. Aula C
Includere Effetti sistematici nel modello: i) misure ausiliarie o regioni di controllo; ii) constraint terms. Forma più generale del Marked Poisson Model. Introduzione a RooStats. I calcolatori di RooStats. Terminologia. Profile likelihood. Intervalli e test di ipotesi con Profile likelihood Ratio.
materiale: http://campus.unibo.it/295300/
- slides - corso da 91 a 127
HOMEWORK:
- Tutorial 5 (http://campus.unibo.it/295300/ )
_____________________________________________________