Foto del docente

Stefano Lodi

Professore associato confermato

Dipartimento di Informatica - Scienza e Ingegneria

Settore scientifico disciplinare: ING-INF/05 SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI

Temi di ricerca

Studio di metodi per il clustering di dati in ambienti centralizzati, distribuiti, streaming, peer-to-peer e reti di sensori. Studio di metodi per la classificazione con support vector machine di dati in ambienti distribuiti e streaming. Riconoscimento di outlier in ambiente distribuito. Reti peer-to-peer semantiche. Tecniche per il raffinamento di cluster in algoritmi di clustering concettuale di tipo pattern-based. Problemi di privatezza e di attacchi inferenziali nel data mining in ambito distribuito con stime kernel di densità. Data mining visuale. Mining di dati biomedici. Rappresentazione della conoscenza.


Gli interessi di ricerca di Stefano Lodi ricadono nell'ambito dei metodi per il riconoscimento di outlier e il clustering di dati in ambiente centralizzato, distribuito, streaming, e nell'ambito dei sistemi di data mining visuali. Si riassumono nel seguito gli argomenti delle ricerche. In ambiente distribuito e streaming, il clustering deve essere effettuato con sufficiente accuratezza anche in assenza di una visione globale dei dati: in ambiente distribuito a causa della eventuale presenza di dati sensibili o di costi di comunicazione eccessivamente elevati; in ambiente streaming per l'impossibilità di visitare i dati passati con modalità ad accesso diretto. In tali ambienti, è necessario utilizzare sinossi additive dei dati di piccola dimensione, sufficienti al calcolo dei cluster. Tali sinossi sono trasmissibili con costi limitati e possono pertanto supportare il clustering distribuito; possono essere efficientemente aggiornate e supportare l'aggiornamento incrementale necessario in ambito streaming. La sinossi considerata nell'ambito delle ricerche è la stima di densità kernel campionata. Il problema del riconoscimento di outlier in ambiente distribuito presenta difficoltà simili. Un approccio basato sulla valutazione delle distanze dai primi k vicini permette di adottare il vicinato di un punto come sinossi. Sono stati affrontati problemi di privatezza e di attacchi inferenziali sui dati soggetti a data mining, in particolare dati di cui è disponibile una stima di densità kernel con parametri pubblicamente noti; inoltre sono allo studio metodi di clustering basati sulla stima di densità kernel che non siano vulnerabili a tali attacchi inferenziali. Stefano Lodi partecipa allo studio del problema del clustering nelle reti peer-to-peer e reti di sensori, iniziato recentemente dal gruppo di ricerca di cui fa parte. In tale ambito, il clustering di dati basato su stime di densità kernel sfrutta principalmente informazioni locali e quindi risente meno dell'elevata dinamicità delle reti; pertanto soluzioni approssimate al problema prodotte da opportuni algoritmi possono risultare molto accurate. Nell'ambito di progetti coordinati nazionali, Stefano Lodi ha studiato i problemi delle interfacce orientate all'utente per la presentazione dei risultati del clustering. Infine, è allo studio una tecnica per raffinare il clustering concettuale prodotto da algoritmi in grado di estrarre pattern-based cluster da un database relazionale.

Ultimi avvisi

Al momento non sono presenti avvisi.