Foto del docente

Gabriele Sirri

Professore a contratto a titolo gratuito

Dipartimento di Fisica e Astronomia "Augusto Righi"

Contenuti utili

[2017/2018] Analisi statistica ... Programma Modulo 3

Analisi Statistica dei Dati nella Fisica Nucleare e Subnucleare
Modulo 3 - Laboratorio

docente: Gabriele Sirri

Anno Accademico 2017/2018

Durante le lezioni sono previste sessioni di esercizi che richiedono la scrittura e l'esecuzione di software basato sul pacchetto ROOT . E' pertanto consigliato l'utilizzo di un proprio computer portatile.

IMPORTANTE: verificate i requisiti per l'utilizzo di ROOT su un portatile personale.

Materiale del corso (slides, testo esercizi e soluzioni) sarà
pubblicato dopo la lezione in: http://campus.unibo.it/295300/

Soluzioni degli esercizi: saranno pubblicate su AMS Campus
e accessibili agli iscritti alla lista docenti-studenti
GABRIELE.SIRRI2.ASD-2017-LAB

_____________________________________________________

Lezione 0
2017.09.28, ore 11-12. Aula C

Introduzione al corso.

Durante questa lezione introduttiva sono mostrati il programma e il calendario del corso. Sono forniti chiarimenti sulle modalità di verifica dell'apprendimento. Sono date indicazioni sullo svolgimento delle esercitazioni di laboratorio.

ROOT.

 Sono mostrate una selezione di slide riassuntive sul framework ROOT (http://root.cern.ch) .

materiale: http://campus.unibo.it/295300/
- slides - introduzione
- slides - ROOT Tutorial (mostrate)


HOMEWORK:

0) iscriversi alla alla lista docenti-studenti GABRIELE.SIRRI2.ASD-2017-LAB

1) Leggere con cura i capitoli “Introduction”, “Conceptual blocks for modeling” di Practical Statistics for the LHC di K. Cranmer (https://arxiv.org/abs/1503.07622)

2) Riprendere in mano i concetti base del C++, in particolare : namespace, classi, classe base e classi derivate, puntatori, reference, passaggio di argomenti by value e by reference, ... Se volete una guida sicura e moderna andate direttamente su http://isocpp.org (A Tour of C++).

3) Esercitarsi con il ROOT PRIMER (almeno fino al paragrafo 3.1) (https://root.cern.ch/root/htmldoc/guides/primer/ROOTPrimer.pdf)

_____________________________________________________

Lezione 1:
2017.10.19, ore 11-14. Aula C

Elementi concettuali della Modellazione

Sono mostrati gli elementi fondamentali della modellazione di un esperimento di fisica delle particelle: ensamble, canale, evento, osservabili, parametri, p.d.f., famiglie di pdf parametriche (il modello), numero atteso di eventi, Marked Poisson model, Likelihood, Likelihood come estimatore, Negative Log Likelihood, Likelihood del Marked Poisson model (likelihood estesa).

Rif. bibliografico: Practical Statistics for the LHC [https://arxiv.org/abs/1503.07622] di K. Cranmer (https://arxiv.org/abs/1503.07622)

Modellazione con RooFit.

Sono state mostrate le funzionalità di RooFit per costruire modelli semplici. Sono state introdotte le classi per definire variabili (RooRealVar), PDFs (RooAbsPdf e le derivate RooGaussian, RooExponential, RooPoisson, RooUniform, RooPolynomial, ... ) e dati (RooAbsData e le derivate RooDataSet, RooDataHist). Differenza tra binned e unbinned dataset. Funzionalità di visualizzazione di RooFit per la visualizzazione di pdf, la generazione di dati (binned e unbinned) tramite toy monte-carlo, la visualizzione di dati, il fit del modello ai dati.


materiale: http://campus.unibo.it/295300/
- slides - corso da 1 a 37

HOMEWORK:
- Tutorial 1 (http://campus.unibo.it/295300/ )

_____________________________________________________

Lezione 2: RooFit Workspace

2017.11.09, ore 11-13 Aula C

E' introdotto il RooWorkspace e la sintassi della Factory: per creare variabili, pdf e funzioni (!) utilizzando anche espressioni.

Modelli Composti: è mostrata la sintassi per costruire con RooFit un modello in cui si sommano 2 o piu' pdf (es. segnale + fondo) utilizzando come coefficienti sia "frazioni" sia "numero atteso di eventi". In questo secondo caso la likelihood utilizza i termini Poissoniani o estesi (likelihood di un marked poisson model).

Rif. bibliografico: manuale di RooFit, per il workspace e la factory slide del corso.

materiale: http://campus.unibo.it/295300/
- slides - corso
da 38 a 52

HOMEWORK:
- Tutorial 2 (http://campus.unibo.it/295300/ )

_____________________________________________________

Lezione 3: Minuit. Likelihood interval. Profile likelihood ratio.
2017.11.16, ore 11-14. Aula C

Sono discusse le soluzioni dei tutorial1 e tutorial2. Sono confrontati esercizio 4 (ROOT) e esercizio 6 (RooFit). Sono discusse le principali differenze tra interpolazione fatta con ROOT e interpolazione fatta con RooFit (utilizzando entrambi i framework nelle loro impostazioni di default).

materiale: http://campus.unibo.it/295300/
- slides - discussione tutorial 1
- slides - discussione tutorial 2

Sono mostrate slide riguardanti i seguenti argomenti: Likelihood interval. Introduzione e utilizzo degli algoritmi di Minuit: MIGRAD, HESSE, MINOS e CONTOUR. Relazione tra RooAbsPdf::fitTo(...) e Minuit. Output di Minuit. Instabilità e correlazione tra parametri. Manipolazione diretta di Likelihood tramite RooFit: minimizzazione della neg log likelihood tramite RooMinuit (migrad, hesse, minos, contour) . Countour plot. NUISANCE PARAMETERS. PROFILE LIKELIHOOD RATIO. Equivalenza tra MINOS e Profile Likelihood Ratio.

materiale: http://campus.unibo.it/295300/
- slides - corso
da 52 a 88

HOMEWORK:
- Tutorial 3 (http://campus.unibo.it/295300/ )

_____________________________________________________

Lezione 4: TMVA
2017.12.07, ore 11-14. Aula C

Sono discusse le soluzioni dei tutorial 2 e 3; in particolare l'equivalenza tra l'intervallo costruito con la profile likelihood e l'intervallo ottenuto gli algoritmi minos/contour di Minuit. 

materiale: http://campus.unibo.it/295300/
- slides - discussione tutorial 2
- slides - discussione tutorial 3

Sono mostrate slide riguardanti TMVA: l'utilizzo di TMVA come classificatore, Boost Decision Tree, Multi-Layer Perceptron, Discriminante di Fisher; curva ROC, definizione di efficienza, purezza dei campioni selezionati. Si è discusso su come effettuare l'ottimizzazione dei tagli per massimizzare il risultato di un esperimento.

materiale: http://campus.unibo.it/295300/
- slides TMVA (Parte 1)
- slides TMVA (Parte 2)

HOMEWORK:
- Tutorial 4 (http://campus.unibo.it/295300/ )

_____________________________________________________

Lezione 5: Problema On/Off. RooStats.
2017.12.14, ore 11-14. ore 11-14. Aula C

Includere Effetti sistematici nel modello: i) misure ausiliarie o regioni di controllo; ii) constraint terms. Forma più generale del Marked Poisson Model. Introduzione a RooStats. I calcolatori di RooStats. Terminologia. Profile likelihood. Intervalli e test di ipotesi con Profile likelihood Ratio.

materiale: http://campus.unibo.it/295300/
- slides - corso
da 91 a 127

HOMEWORK:
- Tutorial 5 (http://campus.unibo.it/295300/ )

_____________________________________________________

 

Ultimi avvisi

Al momento non sono presenti avvisi.