Abstract
Questo progetto di ricerca si propone di sviluppare un quadro metodologico per l’analisi condizionata dell’indice di coda, con l’obiettivo di migliorare la capacità predittiva e inferenziale in presenza di eventi estremi. L’approccio integra strumenti della teoria del valore estremo, dell’econometria e del machine learning per affrontare problemi di previsione di eventi rari e valutare l’impatto delle politiche pubbliche sulle code della distribuzione della variabile di interesse. Le stime incondizionate dell’indice di coda, comunemente adottate nella pratica, assumono un comportamento omogeneo tra le osservazioni, trascurando l’eterogeneità tra gruppi che può risultare determinante per una corretta valutazione dei rischi e per l’identificazione di effetti causali. Un’analisi condizionata consente invece di esplorare come le caratteristiche osservabili influenzino la forma delle code, offrendo una rappresentazione più articolata del fenomeno e strumenti più efficaci per interventi mirati. Il progetto si articola in due linee di ricerca principali. La prima riguarda lo sviluppo di modelli ad albero per la stima dell’indice di coda in contesti ad alta dimensionalità. Questi metodi, largamente diffusi nel machine learning per attività di previsione e classificazione, vengono adattati all’analisi degli estremi attraverso criteri di partizionamento basati su funzioni di coda e tecniche locali di stima. La loro natura non parametrica li rende particolarmente adatti a cogliere relazioni complesse e a selezionare automaticamente le variabili rilevanti, superando i limiti dei modelli parametrici in presenza di molte covariate. Il progetto prevede la formalizzazione delle proprietà teoriche di tali modelli per garantirne la validità inferenziale, oltre alla loro applicazione empirica a contesti di interesse. La seconda linea di ricerca si concentra sull’inferenza causale applicata all’indice di coda. L’obiettivo è definire un effetto di trattamento nella coda, ovvero misurare in che modo un intervento modifichi il comportamento estremo di una variabile di interesse. A tal fine, il progetto estende il tradizionale framework degli esiti potenziali alla stima dell’indice di coda, adattando tecniche consolidate come la regressione discontinua e il metodo delle differenze-in-differenze per isolare effetti causali anche in presenza di confondenti. Questo approccio consente di valutare se una politica abbia impatti non solo sugli esiti medi o sulla distribuzione osservata, ma anche sulla probabilità e severità degli eventi più rari e dannosi, spesso di maggiore rilevanza per i decisori pubblici. I risultati attesi includono lo sviluppo di nuovi modelli teorici e computazionali, la realizzazione di algoritmi implementati in pacchetti software open source, e la loro applicazione a casi di studio con implicazioni pratiche. Il progetto prevede una strategia articolata di disseminazione, che comprende la creazione di un sito web dedicato, la partecipazione a conferenze scientifiche, la pubblicazione dei risultati su riviste di settore e la condivisione del software prodotto. È inoltre prevista l’organizzazione di un workshop volto a presentare le principali innovazioni metodologiche e ad avviare un confronto tra accademici, esperti di politiche e stakeholder. Nel suo complesso, il progetto intende colmare una lacuna metodologica nell’analisi degli eventi estremi, promuovendo l’integrazione tra approcci statistici, econometrici e computazionali per offrire strumenti innovativi a supporto della previsione e della valutazione causale in contesti ad alto rischio.
Dettagli del progetto
Responsabile scientifico: Luca Trapin
Strutture Unibo coinvolte:
Dipartimento di Scienze Statistiche "Paolo Fortunati"
Coordinatore:
Università degli Studi di Trento(Italy)
Contributo totale Unibo: Euro (EUR) 79.640,00
Durata del progetto in mesi: 24
Data di inizio
28/09/2023
Data di fine:
28/02/2026