Elixir x NextGenerationIT: consolidamento dell’Infrastruttura Italiana per i Dati Omici e la Bioinformatica

Area di intervento PNRR: Missione 4 - Istruzione e Ricerca

Componente: 2 - Dalla ricerca all’impresa

Investimento: 3.1 - Fondo per la realizzazione di un sistema integrato di infrastrutture di ricerca e innovazione

Durata: Il progetto terminerà in data 31/10/2025

Quota di finanziamento totale del progetto: € 18.629.476

Proponente: Consiglio Nazionale delle Ricerche

La prevenzione dei tumori attraverso lo studio e la conservazione di dati biologici

Elixir x NextGenerationIT mira a consolidare e rafforzare l’infrastruttura italiana per la ricerca in scienze omiche e nella bioinformatica, nel contesto della infrastruttura europea ESFRI ELIXIR per la Bioinformatica.
Mentre le scienze omiche si basano su tecnologie di analisi che consentono la produzione di un numero elevatissimo di informazioni utili per la descrizione e l'interpretazione dei sistemi biologici, la bioinformatica è dedicata alla risoluzione di problemi biologici a livello molecolare con metodi informatici. Grazie a queste discipline congiunte è possibile quindi studiare le differenze interindividuali che possono portare alla formazione di tumori, grazie alla caratterizzazione sempre più dettagliata dei processi biologici (genetici, cellulari e biochimici) correlati con le caratteristiche morfologiche e funzionali di un organismo.
Il Progetto è coordinato dall’Istituto di Biomembrane, Bioenergetica e Biotecnologie Molecolari del Centro Nazionale delle Ricerche. Lo scopo è quello di mettere a disposizione della ricerca e delle realtà produttive un BioDataCenter che permetta e integri la produzione, l’analisi, la gestione e la preservazione a lungo termine di dati biologici, facilitando e stimolando l’innovazione in diversi ambiti (tra gli altri, le biotecnologie, la medicina di precisione, la farmaceutica, i settori agroalimentare e ambientale).
Tra gli obiettivi principali c’è la costruzione dei presupposti tecnologici per la costituzione di un servizio nazionale, integrato nell’archivio federato Europeo per i dati genomici e fenomici, che consenta, in modalità sicura, la conservazione, la condivisione, l’accesso e l’analisi a dati omici umani sensibili, estremamente rilevanti per la ricerca medica e la pratica clinica.

Struttura del progetto e partecipazione

Composizione della Consorzio

Consiglio Nazionale delle Ricerche
Alma Mater Studiorum - Università di Bologna
Università degli studi di Bari
Università degli studi di Milano
Università degli studi di Milano Bicocca
Università degli studi di Napoli
Università degli studi di Padova

Le persone nel progetto

Le persone dell'Università di Bologna

Referente scientifico

Prof. Pier Luigi Martelli

Le persone assunte sui fondi del progetto

Personale con borsa di dottorato

Elisa Bertolini

Dipartimenti coinvolti

Dipartimento di Farmacia e Biotecnologie — FaBiT

Potenziamento e obiettivi del Biocomputing Group dell'Università di Bologna

L’Università di Bologna ha partecipato a ELIXIRxNextGenerationIT attraverso le attività del Biocomputing Group afferente al Dipartimento di Farmacia e Biotecnologie. Dal 1995, il Biocomputing è impegnato nell’offrire alla comunità scientifica risorse e strumenti di analisi liberamente accessibili come database e web server. I servizi, offerti nell’ambito dell’infrastruttura europea ELIXIR, sono dedicati allo studio delle interazioni dei diversi aspetti strutturali e funzionali delle proteine, in particolare attraverso l’utilizzo di strumenti di informatici di apprendimento automatico.

Con il progetto si sono potenziati tali servizi, tramite l’acquisizione strumentazioni computazionali per la conservazione e l’analisi di dati biologici.

In particolare si sono consentite analisi sempre più efficienti e precise per l’inferenza di caratteristiche strutturali e funzionali di proteine e acidi nucleici, grazie al processamento di grandi masse di dati e lo sviluppo di risorse dati.

Le attività all'interno del progetto:

MultiFacetedProtDB: una banca dati contenente informazioni su proteine multifunzionali umane
Alpha&ESMhFolds: un nuovo database sviluppato in collaborazione con il Centro Nazionale dell’Istituto Nazionale di Fisica Nucleare (CNAF-INFN) per la comparazione di modelli strutturali di 42.942 proteine umane, utilizzando due potenti strumenti: AlphaFold2 e ESMFold. Gli utenti possono confrontare questi modelli con strutture sperimentali ad alta risoluzione disponibili nella Protein Data Bank.
E-SNPs&GO: uno strumento avanzato che utilizza tecniche di apprendimento automatico per la predizione della correlazione tra variazioni del genoma umano e malattie. I ricercatori potranno capire meglio come le differenze genetiche influenzino la salute umane, facilitando la ricerca su nuove terapie e diagnosi.

predisposizione di linee guida, buone pratiche e risorse di dati utilizzati dalla comunità scientifica per la valutazione oggettiva e imparziale di strumenti computazionali di predizione
implementazione di un prototipo per la conservazione e la gestione di dati genomici e fenotipici umani e l'accesso ad essi, nel rispetto di tutte le norme e buone pratiche per la protezione dei dati
pubblicazione di una banca dati contenente informazioni su proteine multifunzionali (MultiFacetedProtDB, in corso di pubblicazione sulla rivista online Nucleic Acids Research, Oxford University Press)

Scopri di più