- Docente: Daniele Bonacorsi
- Crediti formativi: 4
- SSD: FIS/01
- Lingua di insegnamento: Inglese
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Bologna
-
Corso:
Laurea Magistrale in
Bioinformatics (cod. 6767)
Valido anche per Laurea Magistrale in Bioinformatics (cod. 6767)
Laurea Magistrale in Bioinformatics (cod. 8020)
Conoscenze e abilità da conseguire
Al termine del corso lo studente è in grado di gestire i principali concetti di Machine Learning e di applicarli in esempi, dalla preparazione dei dati alla selezione e all'addestramento dei modelli. Questo corso è propedeutico a “Applied Machine Learning - Advanced”, dove lo studente viene introdotto alle tecniche e ai metodi utilizzati in una varietà di applicazioni più avanzate di Machine/Deep Learning in casi d'uso reali.
Contenuti
Il corso prevede lezioni frontali ed esercitazioni (ovvero attività pratiche su argomenti trattati al corso), su questi temi.
Lezioni frontali su:
- Definizioni di Machine Learning
- Tipologie di Machine Learning
- Univariate and Multivariate Linear Regression
- Cost functions
- Gradient Descent and Learning Rate
- Alternatives to Gradient Descent
- Feature scaling, standardisation, normalisation
- Polynomial regression
- Computing parameters analytically: the normal equation
- Classification and representation
- Hypothesis representation and Decision boundaries
- Logistic regression and related cost function
- Multiclass classification
- The problem overfitting
- Regularisation and modified cost functions
- Regularised linear regression, regularised logistic regression
- ML model selection and evaluation
- Static train/validation/test splitting vs cross-validation
- Bias vs Variance diagnosis; learning curves
- Error metrics for skewed classes
- Confusion matrix, Precision, Recall, F1, ROC, AUC
Esercitazioni su:
- Jupyter / Google Colab(oratory)
- Data preparation: loading a dataset
- Data preparation: exploring a dataset
- Data preparation: preparing a dataset for ML
- Data preparation: feature selection
- Data preparation: evaluation with resampling
- Modelling: algorithms' performance metrics
- Modelling: model comparison
- Modelling: algorithm tuning and performance improvements
Testi/Bibliografia
Dato che la bibliografia per questo genere di corso evolve piuttosto rapidamente nel tempo, al fine di non indicare sul sito riferimenti non aggiornati, un elenco di testi e una bibliografia aggiornata viene fornita agli studenti iscritti durante la prima lezione del corso e aggiornata via via che il corso procede. Come riportato anche in altra sezione, si ricorda che il materiale didattico usato a lezione è reso interamente disponibile agli studenti in una repository digitale dedicata al corso.
Metodi didattici
La metodologia didattica del corso prevede:
- Lezioni frontali di tipo tradizionale;
- Notebook interattivi per le parti di esercitazioni che richiedono scrittura di codice.
Il tutto viene integrato con approcci di didattica innovativa che prevedono anche l'uso di connessione Teams, la fruizione di materiale online (es. video) fino all'organizzazione di esperienze di "didattica invertita" su temi specifici.
Le slide e i notebook utilizzati a lezione, unitamente a ogni altro materiale mostrato in aula, vengono interamente messi a disposizione degli studenti. Le slide delle lezioni frontali, in particolare, vengono fornite agli studenti prima dell'erogazione della lezione corrispondente, facilitando gli studenti nel prendere appunti direttamente sul materiale del corso.
Per le esercitazioni non è garantita la disponibilità di aule con PC, quindi si consiglia di portare il proprio computer portatile.
Modalità di verifica e valutazione dell'apprendimento
L'esame si compone di 2 parti, che contribuiscono al voto finale in modo equo (15 punti ciascuna).
1) PROVA SCRITTA (15 punti su 30).
- Obiettivo: verificare l'assorbimento e l'elaborazione consapevole e corretta delle nozioni trasmesse nelle lezioni frontali.
- Partecipazione alla prova: per partecipare a una prova scritta, è obbligatorio iscriversi sul sito Almaesami (almaesami.unibo.it) entro le scadenze fissate, tipicamente alcuni giorni prima della prova stessa.
- Modalità di erogazione: La prova scritta viene eseguita in presenza: eventuali eccezioni che prevedano la possibilità di partecipare da remoto a una prova scritta tramite il sistema Teams vengono considerare se e solo se ne viene presentata richiesta ai docenti per motivate e documentate ragioni, e se e solo se l’opportuna certificazione che attesta la veridicità dell’impedimento raggiunge il responsabile didattico del corso al più tardi una settimana prima della data prevista per la prova.
- Descrizione della prova e della sua valutazione: la prova consiste in un test a scelta multipla, erogato con EOL (eol.unibo.it) o su carta, con una serie di domande di complessità equivalente, ciascuna delle quali assegna un punteggio identico, che è positivo/negativo in caso di risposte corrette/errate (i docenti possono decidere a loro discrezione, in un dato appello o per tutti gli appelli di un anno accademico, di non applicare le penalità). La durata della prova scritta può variare tra minimo 1 ora e massimo 2 ore, a seconda del numero di domande che i docenti scelgono di inserire nella prova e della difficoltà della prova stessa. Si precisa che, per garantire equità ed inclusività, il test non è basato in alcun modo sulla prestazione temporale, ovvero viene lasciato un tempo coerente con il numero di domande, e - in ogni caso - ampiamente sufficiente per riflettere con calma e rispondere a tutte domande del test (almeno 5 minuti per domanda, in media). Durante la prova, è consentito l’uso di calcolatrice, e di ogni tipo di materiale di consultazione in forma cartacea (appunti, libri, dispense, ecc.), compreso il materiale didattico mostrato a lezione e fornito dai docenti; al contrario, non è consentito l’uso di alcun dispositivo/metodo che consenta di comunicare con l’esterno dell’aula (sia con persone sia con strumenti digitali), nonché ogni forma di comunicazione tra studenti/esse in aula durante la prova. La violazione di queste regole determina l’immediato annullamento della prova stessa. La prova scritta si può sostenere ripetutamente, iscrivendosi nuovamente su Almaesami ad appelli successivi, con l’intento di migliorarsi e senza inficiare il voto precedentemente ottenuto: viene infatti sempre tenuto valido il voto migliore ottenuto in prove ripetute da parte dello/a stesso/a studente/essa. Ogni punteggio ottenuto viene considerato valido per un anno solare: se scaduto, lo/a studente/essa deve sottoporsi a una nuova prova scritta.
2) PROGETTO (15 punti su 30).
- Obiettivo: Verificare la capacità di mettere a frutto i contenuti del corso in un progetto (codice).
- Partecipazione alla prova: Non serve segnarsi su Almaesami.
- Modalità di erogazione: Il progetto viene scelto dallo/a studente/essa, o sulla base di una propria proposta o selezionato da una lista fornita dai docenti. Deve essere comunicata ai docenti l'intenzione di lavorare a un determinato progetto e una sua sintetica descrizione, e ottenuto il consenso dei docenti a intraprendere il progetto proposto.
- Descrizione della prova e della sua valutazione: Le modalità di consegna dei progetti e le tempistiche di correzione vengono illustrate nella prima lezione del corso. Il progetto verrà valutato principalmente sulla base di: chiarezza della spiegazione degli obiettivi e dell'approccio seguito per raggiungerli; qualità del codice implementato per raggiungere gli obiettivi; documentazione e presentazione complessiva del progetto. Ogni progetto può essere sottomesso un massimo di 2 volte: dopo la prima sottomissione si riceve feedback e una proposta di punteggio, sulla base dei quali lo/a studente/ssa può decidere se accettare, o se proseguire implementando i commenti nell’ottica di cercare di migliorarsi con una seconda (e ultima) sottomissione; qualora non si accetti il secondo punteggio proposto, non si potrà ripresentare lo stesso progetto una terza volta, ma si dovrà proporre per la prima volta un progetto differente. In presenza di particolari esigenze degli studenti (es. scadenze per borse di studio, scadenze in vista delle sessioni di discussione delle tesi finali, ecc) - tali modalità e tempistiche si possono discutere individualmente con i docenti, che offrono la massima disponibilità a venire incontro alle esigenze degli/delle studenti/esse, nei limiti entro i quali devono restare per garantire un equo trattamento a tutti/e gli/le studenti/esse.
A fronte di queste tre parti distinte, il massimo punteggio che uno/a studente/essa può ottenere è 15+15=30. Un'eventuale lode (30L) viene assegnata a studenti/esse che abbiano ottenuto il massimo in ciascuna delle parti dell’esame, e la cui prova complessiva venisse ritenuta dai docenti, all’unanimità, di livello eccellente.
Studenti/sse con DSA o disabilità temporanee o permanenti: si raccomanda di contattare per tempo l’ufficio di Ateneo responsabile (https://site.unibo.it/studenti-con-disabilita-e-dsa/it). Sarà cura dell’ufficio competente proporre agli/lle studenti/esse interessati/e eventuali adattamenti, che dovranno comunque essere sottoposti, con un anticipo di 15 giorni, all’approvazione del/della docente, che ne valuterà l'opportunità anche in relazione agli obiettivi formativi dell'insegnamento.
Strumenti a supporto della didattica
Come spiegato nelle sezioni precedenti, vengono utilizzate:
- slides per le lezioni frontali;
- materiale audio-visivo;
- articoli scientifici rilevanti;
- dispense.
Tutto il materiale usato a lezione viene messo a disposizione degli/delle studenti/esse in una repository digitale condivisa. Inoltre, nelle modalità didattiche innovative, viene fatto uso di strumenti di videoconferenza come Teams, nonché di strumenti digitali per erogare questionari e verificare l’assorbimento dei contenuti erogati.
Orario di ricevimento
Consulta il sito web di Daniele Bonacorsi