Sviluppo di piattaforme Cloud per la genomica
La mia ricerca di dottorato si concentra sulla progettazione e realizzazione di infrastrutture cloud-native per la genomica computazionale ad alte prestazioni, con l’obiettivo di supportare l’esecuzione scalabile, riproducibile e sicura di pipeline bioinformatiche su grandi volumi di dati. Il lavoro affronta le principali sfide legate all’analisi genomica moderna, tra cui la gestione efficiente delle risorse computazionali, l’orchestrazione di workflow complessi e la portabilità del software, adottando tecnologie di containerizzazione, orchestrazione tramite Kubernetes e workflow management basato su Nextflow.
La sicurezza e la governance dei dati genomici sono aspetti fondamentali della ricerca, in particolare nel contesto clinico. Il progetto studia l’integrazione di sistemi di autenticazione e autorizzazione centralizzati basati su OAuth2, JWT e federazione delle identità, con un controllo rigoroso dei permessi a livello di file system e workflow.
Implementazione di pipeline di analisi genomica
Un altro filone della mia ricerca riguarda la progettazione e l’implementazione di pipeline bioinformatiche per l’analisi dei dati genomici. L’obiettivo è creare pipeline modulari, riproducibili e ottimizzate per l’esecuzione in ambienti cloud ad alte prestazioni, garantendo al contempo la scalabilità su grandi cohort di campioni. L’implementazione sfrutta Nextflow per l'esecuzione di processi containerizzati (Docker e Apptainer), integrando strumenti standardizzati e open source per il controllo di qualità, l’allineamento dei reads, la chiamata di varianti e l’annotazione genomica.