Foto del docente

Stefano Diciotti

Professore associato

Dipartimento di Ingegneria dell'Energia Elettrica e dell'Informazione "Guglielmo Marconi"

Settore scientifico disciplinare: ING-INF/06 BIOINGEGNERIA ELETTRONICA E INFORMATICA

Didattica

Argomenti di tesi proposti dal docente.

Valutazione di algoritmi di self-supervised learning per dati medici sbilanciati

Il self-supervised learning è una tecnica di machine learning in cui un modello impara a estrarre rappresentazioni significative da dati non etichettati creando le proprie etichette o obiettivi. Ciò consente al modello di catturare informazioni utili e trasferirle ad altri task senza dipendere da annotazioni umane esplicite.

Questa tesi mira a esplorare l'applicazione degli algoritmi di self-supervised learning per affrontare le sfide poste dai dati medici sbilanciati nell'ambito dell'intelligenza artificiale per la medicina. I dataset sbilanciati, in cui il numero di campioni nelle diverse classi è significativamente disuguale, sono diffusi nei domini medici e costituiscono ostacoli significativi per sistemi basati su intelligenza artificiale accurati e affidabili. In questo studio, indagheremo e valuteremo la robustezza di vari approcci di self-supervised learning a questo problema.

Attraverso sperimentazioni e valutazioni rigorose, questa tesi mira a fornire preziose intuizioni sui punti di forza e limitazioni del self-supervised learning nel contesto dei dati medici sbilanciati. I risultati di questa ricerca contribuiranno a migliorare lo sviluppo di modelli AI robusti e accurati per applicazioni mediche, migliorando in ultima analisi la diagnosi, il trattamento e la cura dei pazienti nella pratica clinica.

I dati potranno essere di tipo imaging o tabulare, ad esempio per la classificazione dei pazienti affetti da malattia di Alzheimer da immagini di risonanza magnetica cerebrale.

 

Esplorazione del ruolo delle tecniche classiche di data augmentation nella sintesi basata su conditional GAN: verso la generazione di immagini mediche sintetiche di alta qualità

Questa tesi si propone di investigare e confrontare l'impatto dell'addestramento di una Generative Adversarial Network (GAN) su un normale dataset rispetto a un dataset arricchito con tecniche di data augmentation classiche. L'obiettivo finale è migliorare la qualità delle immagini sintetiche generate attraverso la sintesi condizionale e potenzialmente creare un dataset sintetico di alta qualità.

Attraverso una valutazione approfondita, questa tesi esplora come l'applicazione di tecniche classiche di data augmentation, come il flip, il crop e altre trasformazioni comunemente utilizzate, possano migliorare le prestazioni e la fedeltà della sintesi condizionale basata su GAN. La ricerca utilizzerà il dataset ADNI (Alzheimer's Disease Neuroimaging Initiative), che comprende scansioni di risonanza magnetica cerebrale di individui diagnosticati con la malattia di Alzheimer e soggetti di controllo sani. Attraverso un confronto sistematico dei risultati ottenuti dall'addestramento delle GAN su dataset sia aumentati che non aumentati, lo studio mira a fornire indicazioni sull'efficacia del data augmentation classico nella generazione di immagini sintetiche per diverse applicazioni mediche.

I risultati di questa ricerca contribuiranno ad avanzare il campo della sintesi condizionale basata su GAN, identificando gli approcci che portano a immagini sintetiche di qualità superiore. Le conseguenze saranno significative per applicazioni come l'imaging medico, dove spesso l'accesso a dataset ampi e diversificati è limitato.

 

Studio dell'impatto dei dati sintetici sulle prestazioni di classificazione delle CNN: comparazione con tecniche classiche di data augmentation

Questa tesi mira a valutare il potenziale dei dati sintetici nel migliorare le prestazioni di classificazione delle Convolutional Neural Networks (CNN). Lo studio coinvolge tre diverse condizioni: addestramento di una CNN con un dataset normale, addestramento di una CNN con un dataset aumentato utilizzando tecniche classiche di data augmentation e addestramento di una CNN con un dataset sintetico generato da una GAN condizionale capace di eseguire la sintesi condizionale delle immagini.

Il dataset utilizzato in questa ricerca sarà il dataset ADNI (Alzheimer's Disease Neuroimaging Initiative), composto da scansioni di risonanza magnetica cerebrale di pazienti affetti da malattia di Alzheimer (AD) e soggetti di controllo sani (HC). Il dataset sintetico verrà creato utilizzando una GAN condizionale esistente, specificamente progettata dal nostro gruppo di ricerca per la sintesi di scansioni di risonanza magnetica cerebrale di pazienti con AD e HC. Attraverso un'analisi comparativa, questo studio cerca di determinare se l'addestramento di una CNN con dati sintetici può fornire prestazioni di classificazione migliorate rispetto all'addestramento con dataset tradizionali e dataset aumentati.

I risultati di questo studio forniranno preziose intuizioni sui potenziali vantaggi dei dati sintetici e sulla loro capacità di migliorare le attività di classificazione basate su CNN. Questa ricerca ha implicazioni significative in diversi settori, come l'imaging medico e la computer vision, dove l'accesso limitato a dataset etichettati può rappresentare un limite.

Ultimi avvisi

Al momento non sono presenti avvisi.