Elixir x NextGenerationIT: consolidamento dell’Infrastruttura Italiana per i Dati Omici e la Bioinformatica

Il progetto sostiene l’offerta italiana in termini di produzione di dati genomici, stimolando l’innovazione nelle biotecnologie, nella medicina di precisione, nella farmaceutica, nei settori agroalimentare e ambientale.

Dettaglio laboratorio bioinformaticoArea di intervento PNRR: Missione 4 - Istruzione e Ricerca

Componente: 2 - Dalla ricerca all’impresa

Investimento: 3.1 - Fondo per la realizzazione di un sistema integrato di infrastrutture di ricerca e innovazione

Durata: Il progetto terminerà in data 4/30/2025

Quota di finanziamento totale del progetto: € 18.629.476

Proponente: Consiglio Nazionale delle Ricerche

La prevenzione dei tumori attraverso lo studio e la conservazione di dati biologici

Elixir x NextGenerationIT mira a consolidare e rafforzare l’infrastruttura italiana per la ricerca in scienze omiche e nella bioinformatica, nel contesto della infrastruttura europea ESFRI ELIXIR per la Bioinformatica.
Mentre le scienze omiche si basano su tecnologie di analisi che consentono la produzione di un numero elevatissimo di informazioni utili per la descrizione e l'interpretazione dei sistemi biologici, la bioinformatica è dedicata alla risoluzione di problemi biologici a livello molecolare con metodi informatici. Grazie a queste discipline congiunte è possibile quindi studiare le differenze interindividuali che possono portare alla formazione di tumori, grazie alla caratterizzazione sempre più dettagliata dei processi biologici (genetici, cellulari e biochimici) correlati con le caratteristiche morfologiche e funzionali di un organismo.
Il Progetto è coordinato dall’Istituto di Biomembrane, Bioenergetica e Biotecnologie Molecolari del Centro Nazionale delle Ricerche. Lo scopo è quello di mettere a disposizione della ricerca e delle realtà produttive un BioDataCenter che permetta e integri la produzione, l’analisi, la gestione e la preservazione a lungo termine di dati biologici, facilitando e stimolando l’innovazione in diversi ambiti (tra gli altri, le biotecnologie, la medicina di precisione, la farmaceutica, i settori agroalimentare e ambientale).
Tra gli obiettivi principali c’è la costruzione dei presupposti tecnologici per la costituzione di un servizio nazionale, integrato nell’archivio federato Europeo per i dati genomici e fenomici, che consenta, in modalità sicura, la conservazione, la condivisione, l’accesso e l’analisi a dati omici umani sensibili, estremamente rilevanti per la ricerca medica e la pratica clinica.

Struttura del progetto e partecipazione

Composizione della Consorzio

  • Consiglio Nazionale delle Ricerche
  • Alma Mater Studiorum - Università di Bologna
  • Università degli studi di Bari
  • Università degli studi di Milano
  • Università degli studi di Milano Bicocca
  • Università degli studi di Napoli
  • Università degli studi di Padova

Le persone nel progetto 

Le persone dell'Università di Bologna

Referente scientifico 

Prof. Pier Luigi Martelli 

Le persone assunte sui fondi del progetto

Personale con borsa di dottorato

  • Elisa Bertolini

Dipartimenti coinvolti  

  • Dipartimento di Farmacia e Biotecnologie — FaBiT

Potenziamento e obiettivi del Biocomputing Group dell'Università di Bologna

L’Università di Bologna partecipa a ELIXIRxNextGenerationIT attraverso le attività del Biocomputing Group afferente al Dipartimento di Farmacia e Biotecnologie. Dal 1995, il Biocomputing è impegnato nell’offrire alla comunità scientifica risorse e strumenti di analisi liberamente accessibili come database e web server. I servizi, attualmente offerti nell’ambito dell’infrastruttura europea ELIXIR, sono dedicati allo studio delle interazioni dei diversi aspetti strutturali e funzionali delle proteine, in particolare attraverso l’utilizzo di strumenti di informatici di apprendimento automatico.

Con il progetto si andranno a potenziale tali servizi, tramite l’acquisizione strumentazioni computazionali per la conservazione e l’analisi di dati biologici.

In particolare saranno consentite analisi sempre più efficienti e precise per l’inferenza di caratteristiche strutturali e funzionali di proteine e acidi nucleici, grazie al processamento di grandi masse di dati e lo sviluppo di risorse dati. 

I servizi già rilasciati grazie al progetto 

  • MultiFacetedProtDB: una banca dati contenente informazioni su proteine multifunzionali umane
  • Alpha&ESMhFolds:un nuovo database sviluppato in collaborazione con il Centro Nazionale dell’Istituto Nazionale di Fisica Nucleare (CNAF-INFN) per la comparazione di modelli strutturali di 42.942 proteine umane, utilizzando due potenti strumenti: AlphaFold2 e ESMFold. Gli utenti possono confrontare questi modelli con strutture sperimentali ad alta risoluzione disponibili nella Protein Data Bank.
  • E-SNPs&GO: uno strumento avanzato che utilizza tecniche di apprendimento automatico per la predizione della correlazione tra variazioni del genoma umano e malattie. I ricercatori potranno capire meglio come le differenze genetiche influenzino la salute umane, facilitando la ricerca su nuove terapie e diagnosi.

Quali attività in corso?

In particolare, i ricercatori si stanno occupando delle seguenti attività:

  • predisposizione di linee guida, buone pratiche e risorse di dati che possano essere utilizzati dalla comunità scientifica per la valutazione oggettiva e imparziale di strumenti computazionali di predizione
  • implementazione di un prototipo che permetta la conservazione e la gestione di dati genomici e fenotipici umani e l'accesso ad essi, nel rispetto di tutte le norme e buone pratiche per la protezione dei dati
  • pubblicazione di una banca dati contenente informazioni su proteine multifunzionali (MultiFacetedProtDB, in corso di pubblicazione sulla rivista online Nucleic Acids Research, Oxford University Press)
  • predisposizione di linee guida, buone pratiche e risorse di dati che possano essere utilizzati dalla comunità scientifica per la valutazione oggettiva e imparziale di strumenti di deduzione
  • implementazione di un prototipo che permetta la conservazione e la gestione di dati genomici e fenotipici umani nel rispetto di tutte le norme e buone pratiche per la protezione dei dati

Scopri di più

Logo a 4 PNRR 111024 - padding