66573 - LABORATORY OF BIOINFORMATICS 2

Anno Accademico 2024/2025

  • Docente: Castrense Savojardo
  • Crediti formativi: 10
  • SSD: BIO/10
  • Lingua di insegnamento: Inglese
  • Moduli: Castrense Savojardo (Modulo 1) Castrense Savojardo (Modulo 2)
  • Modalità didattica: Convenzionale - Lezioni in presenza (Modulo 1) Convenzionale - Lezioni in presenza (Modulo 2)
  • Campus: Bologna
  • Corso: Laurea Magistrale in Bioinformatics (cod. 8020)

Conoscenze e abilità da conseguire

At the end of the course, the student acquires expertise on the selection and/or development and application of tools useful to address important problems of Bioinformatics and to verify the capability in handling autonomously a research project. The student will be acquainted with: - analyzing a research project where the bioinformatic approach is required; - developing the project workflow with all the necessary steps; - evaluating all the possible risks of failure and success probability; - applying of selected bioinformatics tools for the project outcomes; - developing the required software if necessary; - analyzing the results in terms of their exportability to a wet lab; - drawing conclusions in terms of benefits vs. putative costs.

Contenuti

Il corso è incentrato sullo sviluppo di un progetto bioinformatico, attraverso l’applicazione di metodologie di apprendimento automatico.

Saranno trattate le seguenti tematiche:

  • Costruzione e curazione di dataset biologici (incluse sequenze e/o strutture proteiche)
  • Preprocessing dei dataset per l’applicazione di tecniche di apprendimento automatico
  • Tecniche di rappresentazione delle proteine: codifica one-hot, profili di sequenza derivati da allineamenti multipli, rappresentazioni basate su caratteristiche fisico-chimiche e metodi avanzati basati su deep learning (es. embeddings)
  • Metodologie di estrazione e selezione delle caratteristiche, sia manuali sia automatiche
  • Riduzione della ridondanza nei dataset biologici, con particolare attenzione alle tecniche di clustering di sequenze
  • Sviluppo e implementazione di modelli predittivi in ambito bioinformatico, inclusi classificatori e regressori
  • Strategie per la selezione e l’ottimizzazione degli iperparametri nei modelli di apprendimento automatico
  • Metriche e metodologie di valutazione delle prestazioni dei modelli in contesti bioinformatici
  • Presentazione e discussione critica dei risultati

Inoltre, verranno svolte lezioni teoriche dedicate ai seguenti argomenti fondamentali e avanzati:

  • Architetture principali delle reti neurali profonde (inclusi percettroni multistrato, reti neurali convoluzionali, reti neurali ricorrenti e reti neurali a grafo) e loro applicazioni in bioinformatica
  •  Meccanismi di attenzione e modelli transformer, con particolare riferimento al loro impiego nella predizione della struttura e della funzione delle proteine
  • Modelli linguistici e modelli linguistici specifici per le proteine, per la codifica ad alta dimensionalità delle sequenze proteiche

Testi/Bibliografia

Rassegne ed articoli selezionati in cloud sharing

Metodi didattici

Lezioni ed esercitazioni. Sviluppo di un progetto bioinformatico.

Modalità di verifica e valutazione dell'apprendimento

L’esame finale ha l’obiettivo di valutare il raggiungimento degli obiettivi formativi del corso, con particolare riferimento alla formazione di uno specialista in Bioinformatica.
La competenza del candidato sarà valutata in base alla sua capacità di sviluppare un progetto bioinformatico, da consegnare al docente prima dell’esame orale sotto forma di manoscritto strutturato secondo i criteri di una pubblicazione scientifica. Il manoscritto dovrà includere: Introduzione, Materiali e Metodi, Sviluppo Algoritmico, Risultati e Discussione.

L’esame orale verterà su tematiche relative allo sviluppo del progetto e su concetti teorici affrontati durante il corso.

Strumenti a supporto della didattica

Online, Data Base Pubblici, PubMed, e materiale (pdf delle lezioni e articoli selezionati)

In considerazione della tipologia di attività e dei metodi didattici adottati, la frequenza di questa attività formativa richiede la preventiva partecipazione di tutti gli studenti ai Moduli 1 e 2 di formazione sulla sicurezza nei luoghi di studio, [https://elearning-sicurezza.unibo.it/] in modalità e-learning.

Orario di ricevimento

Consulta il sito web di Castrense Savojardo