Foto del docente

Enrico Gallinucci

Ricercatore in Tenure Track L. 79/2022

Dipartimento di Informatica - Scienza e Ingegneria

Settore scientifico disciplinare: ING-INF/05 SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI

Temi di ricerca

Parole chiave: Big Data Database NoSQL Analisi di Dati Social Analisi di dati di traiettoria Agricoltura di Precisione Business Intelligence Machine Learning Analisi OLAP Data Warehouse Web Semantico

Big Data: il termine si riferisce a dataset talmente grandi e complessi (specialmente in termini di volume, varietà e velocità) da richiedere l'utilizzo di tecniche e metodologie innovative per gestire la memorizzazione e l'analisi dei dati. Una piattaforma big data si costruisce utilizzando cluster di comuni workstation, in cui la complessità del sistema distribuito è gestita a livello software da framework che si occupano della distribuzione dei dati e della computazione (ad esempio, Apache Hadoop e tutti gli strumenti ad esso correlati). In questo ambito, l'attività di ricerca si focalizza in primo luogo sullo sviluppo di approcci intelligenti per supportare il data scientist nella ricerca, l'organizzazione e l'analisi dei dati. L'obiettivo è quello di implementare una data platform in grado di riconoscere e riconciliare i dati all'interno del data lake, offrendo al data scientist un livello di astrazione attraverso il quale individuare, gestire ed interrogare i dati di interesse. Un altro tema di ricerca consiste nella progettazione di algoritmi di analisi e data mining che sfruttino il parallelismo offerto dalla piattaforma per elaborare big data in maniera scalabile; questo tema viene affrontato in particolar modo nell'analisi di dati di traiettoria (trajectory mining).

NoSQL databases: l'incapacità dei DBMS relazionali di scalare agevolmente in un contesto big data ha portato alla diffusione di una nuova generazione di database, i quali si fondano su modelli dati diversi da quello relazionale e mettono al centro il deployment su architetture distribuite. Una delle caratteristiche principali dei databse NoSQL è la modellazione dei dati attraverso un concetto di soft-schema, che consente a più istanze di dati di coesistere all'interno di una stessa collezione senza uno schema predefinito. Un primo problema di ricerca affrontato consiste nel risolvere l'eterogeneità di schema all'interno di una collezione attraverso l'utilizzo di tecniche di schema profiling che supportano l'analista nella ricognizione degli attributi principali e nelle regole che guidano l'utilizzo dei diversi schemi. Inoltre, i sistemi NoSQL sono spesso attualmente utilizzati in contesti poliglotti, in cui tecnologie diverse (incluse quelle relazionali) vengono utilizzare per memorizzare porzioni diverse e potenzialmente sovrapposte di un sistema informativo. In questo contesto, l'attività di ricerca consiste nella realizzazione di un sistema multistore, in grado di automatizzare l'integrazione dei dati presenti nei diversi DBMS e di offrire all'analista un'interfaccia per interrogare gli stessi in maniera trasparente, gestendo allo stesso tempo tutte le problematiche relative alla sovrapposizione dei dati e all'eterogeneità di tecnologie e di schemi diversi.

Non-conventional Business Intelligence: il termine Business Intelligence (BI) indica un'ampia categoria di applicazioni informatiche atte a raccogliere, gestire ed analizzare dati al fine di aiutare i manager a prendere decisioni migliori. Al centro di un sistema di BI si trova normalmente un Data Warehouse, ossia un database specializzato nella memorizzazione di informazioni organizzate in base a uno schema multidimensionale ottimizzato per l'esecuzione di interrogazioni di analisi. Il tema di ricerca fa riferimento all'estensione delle tecniche tradizionali di BI per integrare ed analizzare dati provenienti da fonti diverse dal classico contesto aziendale. In questa direzione, una delle fonti principali è costituita dai contenuti pubblicati sui social network, per la cui gestione è stata proposta una metodologia di Social BI ed un'innovativa estensione delle tradizionali tecniche di modellazione del data warehouse. Diversi progetti di ricerca si sono sviluppati intorno a questa tematica, con focus particolare sul profiling degli utenti attività negli ambiti della politica e delle vaccinazioni. Un'ulteriore tematica di ricerca riguarda l'integrazione del data warehouse con i dati provenienti dal mondo del web semantico, con particolare riferimento ai linked open data.

Agricoltura di precisione: il termine fa riferimento all'ottimizzazione dei processi operativi e decisionali nel mondo dell'agricoltura attraverso l'utilizzo di tecnologie avanzate per la raccolta e l'analisi dei dati. Il contesto di innovazione parte dall'utilizzo sul campo di dispositivi smart, passa per l'integrazione dei dati raccolti on-situ con dati aziendali ed open data (quali immagini satellitari e dati meteo) e culmina con la realizzazione di un sistema di supporto alla decisioni in grado di generare conoscenza su aspetti diversa della filiera di produzione. In questo contesto, il tema di ricerca specifico riguarda la realizzazione di una piattaforma big data dedicata alla raccolta e all'integrazione delle diverse fonti di dati, nonché l'applicazione di tecniche di analisi prescrittive per modellare la diffusione dell'acqua nel terreno e supportare l'agricoltore nell'ottimizzazione dell'utilizzo della risorse idriche.

Ultimi avvisi

Al momento non sono presenti avvisi.