Le linee di ricerca principali di PLM riguardano lo
sviluppo di sistemi basati su reti neurali, Hidden Markov Model e
Support Vector Machine per la predizione di caratteristiche
strutturali e funzionali di proteine. In particolare ha sviluppato
sistemi per la predizione della struttura secondaria di proteine,
della topografia e topologia di proteine di membrana (interna ed
esterna), dello stato di legame delle cisteine, della
localizzazione subcellulare. Si è occupato inoltre dello studio e
simulazione del folding di proteine, della predizione di strutture
tridimensionali di proteine integrando informazioni sequenziali e
sperimentali, della stabilità delle proteine tramite metodi di
dinamica molecolare e dello studio della interazione tra piccoli
ligandi e proteine mediante tecniche di docking molecolare.
Protein Folding e Biofisica Molecolare Teorica
A partire dal 1996, durante il suo lavoro di tesi di laurea in
Fisica, PLM si è occupato di aspetti riguardanti lo studio teorico
del problema folding affrontati mediante metodi computazionali
basati su reti neurali e algoritmi genetici. In particolare lo
studio delle proprietà delle reti neurali ha permesso di sviluppare
un criterio entropico in grado di selezionare frammenti di
alfa-eliche che abbiano elevata probabilità di essere siti di
nucleazione per il folding di proteine. Sulla base di tale criterio
si è sviluppato un sistema basato sull'accoppiamento di reti
neurali e algoritmi genetici utili per la progettazione di peptidi
a conformazione predeterminata. I principali risultati ottenuti
sono:
-
la predizione di siti di iniziazione del folding in proteine e
la loro conservazione in proteine con identità di sequenza fino al
30% .
-
la costruzione di una banca dati di frammenti di alfa-eliche che
possono essere utilizzati come elementi essenziali nella
ingegnerizzazione di peptidi a struttura predeterminata.
Predizione delle Strutture di Proteine
A partire dal 1997, durante il suo lavoro di ricerca nell'ambito
del dottorato in Fisica e in collaborazione col prof. Anders Krogh
della Technical University of Denmark, PLM si è occupato
principalmente dello studio dei sistemi di "machine learning" volti
alla predizione delle caratteristiche morfo-funzionali delle
proteine a partire dalla loro sequenza amminoacidica. Generalmente
l'analisi di sequenze di proteine viene svolta con tecniche diverse
basate sull'uso di reti neurali supervisionate e non, algoritmi
genetici e “hidden Markov model” (HMM). In particolare il
sottoscritto si è occupato della progettazione e
dell'implementazione di sistemi integrati di Reti Neurali e "hidden
Markov model" che permettono di unire l'alta efficienza delle prime
alla capacità che posseggono i secondi di strutturare le predizioni
in maniera sintatticamente corretta. Tali sistemi hanno inoltre
permesso di costruire per la prima volta predittori a "hidden
Markov models" capaci di elaborare l'informazione evolutiva
contenuta negli allineamenti multipli di sequenza.
Con tali metodi è stato sviluppato un predittore a Hidden Markov
Model di proteine di membrana a "beta-barrel". Gli HMM sviluppati
hanno inoltre permesso la costruzione di predittori integrati con
reti neurali per la predizione dello stato di legame delle cisteine
in una catena proteica. I predittori per la struttura delle
proteine beta-barrel di membrana e per lo stato di legame delle
cisteine sviluppati con questi metodi sono i migliori oggi
disponibili. Con gli stessi metodi si è sviluppato un predittore
per le proteine della membrana interna (all-alfa). I predittori per
le proteine di membrana (esterna ed interna) hanno dimostrato una
buona capacità discriminativa e sono stati quindi integrati in un
sistema (Hunter), in grado di rintracciare e distinguere le
proteine della membrana interna e quelle della membrana esterna
all'interno dei genomi dei batteri Gram negativi. I predittori
implementati sono stati integrati in un sistema accessibile dalla
comunità scientifica tramite rete Internet e chiamato TRAMPLE.
Inoltre il sottoscritto ha partecipato all'implementazione di un
predittore di struttura secondaria a Reti Neurali e ha collaborato
in progetti volti a valutare l'efficienza predittiva delle Reti
Neurali.
Protein Modeling e Relazione Struttura-Funzione
Nell'ambito di collaborazioni del gruppo di Biocomputing del
CIRB con altri gruppi di ricerca PLM ha svolto studi sul rapporto
struttura-funzione in proteine di particolare interesse
applicativo, utilizzando gli strumenti del modelling, della
dinamica molecolare e del docking. Poiché la struttura
tridimensionale delle proteine determina la loro funzione, il primo
passo di tali studi consiste nella predizione della struttura 3D
della proteina, qualora questa non sia disponibile. Tale compito
viene affrontato sfruttando l'omologia con proteine di struttura
nota e con l'ausilio dei predittori di caratteristiche strutturali
disponibili, alcuni dei quali sviluppati dal gruppo di Biocomputing
del CIRB. Altri studi sulla stabilità e la dinamica in soluzione e
sotto differenti condizioni vengono condotti tramite simulazioni di
dinamica molecolare. I metodi di "docking" permettono poi di
studiare i problemi legati al riconoscimento molecolare. I dati
ottenuti vengono confrontati con i dati sperimentali ottenuti dai
gruppi con cui collaboriamo e interpretati con modelli teorici. I
principali risultati ottenuti sono:
-
Costruzione di modelli tridimensionali di proteine termofile
allo scopo di indagare le caratteristiche che contribuiscono alla
loro stabilità a temperature attorno ai 90° C: in particolare i
modelli del tetramero di carbossipeptidasi e del tetramero di
alcool deidrogrenasi di carbossipeptidasi di Sulfolobus
solfataricus.
-
Costruzione e studio tramite dinamica molecolare di modelli di
enzimi utilizzati in bioreattori allo scopo di studiare gli effetti
dell'immobilizzazione sulla loro stabilità strutturale . Gli enzimi
su cui tali studi sono stati effettuati sono l'ureasi di fagiolo,
la beta-galattosidasi di Aspergillus oryzae e la laccasi di
Rhus vernicifera.
-
Studio dell'effetto destabilizzante sulla struttura della
mioglobina della doppia mutazione dei triptofani in posizione 7 e
14 nella sequenza, tramite dinamica molecolare.
-
Studio tramite dinamica molecolare delle proprietà di emissione
di fluorescenza dei triptofani della beta-galattosidasi di
Sulfolobus solfataricus.
-
Modelling della integrina alphav-beta3 e ricerca di un inibitore
basato su molecole peptidomimetiche.
-
Individuazione e studio di un peptide fusogenico della
glicoproteina H del virus Herpes simplex.
Predizione della localizzazione subcellulare di
proteine
Un recente campo di ricerca riguarda la predizione della
localizzazione subcellulare delle proteine globulari e di membrana
a partire dalla sequenza amminoacidica. Questo problema è di
estrema rilevanza per la determinazione della funzione delle
proteine, in particolare nel caso degli organismi eucarioti. A
questo scopo è stato implementato BaCelLo, un sistema basato su un
albero decisionale si Support Vector Machine capace di discriminare
4 localizzazioni per le proteine da animali e funghi (spazio
extracitoplasmatico, citoplasma, mitocondri, nucleo) e 5 per le
proteine da piante (alle precedenti vengono aggiunti i
cloroplasti). BaCelLo è stato addestrato e valutato su insiemi
rigorosamente non ridondanti di proteine, al contrario della
maggior parte dei predittori attualmente disponibili.
Utilizzando in serie i nostri predittori per il peptide segnale,
per le strutture transmembrana e per la localizzazione cellulare, è
stata predetta la localizzazione subcellulare di interi genomi.
Tale predizione viene confrontata con la localizzazione riportata
nei file SwissProt e con con quella inferita tramite omologia.
Per quel che riguarda le proteine di membrana, è stato
implementato PredGPI, uno strumento computazionale per determinare
se una proteina sia ancorata alla membrana tramite un'ancora GPI e,
nel caso, quale sia il sito nella porzione C-terminale su cui
avviene l'ancoraggio.