85302 - DATA SCIENCE

Anno Accademico 2025/2026

  • Docente: Domenico Di Sante
  • Crediti formativi: 6
  • SSD: FIS/07
  • Lingua di insegnamento: Italiano
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Bologna
  • Corso: Laurea in Scienza dei materiali (cod. 5940)

Conoscenze e abilità da conseguire

Al termine del corso lo studente possiede una conoscenza dei metodi fondamentali di analisi di dati complessi. Conosce gli algoritmi principali e più moderni per l'analisi dei dati e sa implementarli in un linguaggio di programmazione. L'attività laboratoriale permette allo studente di implementare ed eseguire analisi di dati al calcolatore ed applicare le metodologie studiate a casi prova.

Contenuti

Sillabo sintetico:

  • Parte I: Introduzione ai metodi fondamentali del calcolo scientifico (algebra lineare ed ottimizzazione)
  • Parte II: Machine Learning

Sillabo dettagliato:

Parte I: Introduzione ai metodi fondamentali del calcolo scientifico

1 – Introduzione: informazioni di carattere generale ed amministrativo.

2 – Algebra lineare:

  •  Spazi vettoriali, operazioni con matrici
  •  Problemi agli autovalori
  •  Decomposizione SVD
  •  Altri tipi di decomposizione (LU, QR, Cholesky)
  •  Sistemi di equazioni lineari

3 – Ottimizzazione:

  •  Derivate, gradienti, Jacobiano, Hessiano
  •  Diversi tipi di ottimizzazione (locale, globale, convessa, non-convessa)
  •  Metodi di ottimizzazione (first-order, second-order)
  •  Stochastic gradient descent SGD

Parte II: Machine Learning

1 – Modelli lineari:

  • Regressione binaria (logistica)
  • Regressione lineare ai minimi quadrati
  • Regolarizzazione (l1 e sparsita’)
  • Splines
  • Modelli lineari generalizzati

2 – Strutturare i dati senza reti neurali:

  •  Riduzione della dimensionalita’
  •  Principal component analysis (PCA)
  •  Kernel PCA
  •  Algoritmi di raggruppamento (k-means)

3 – Supervised Learning:

  •  Reti neurali
  •  Training e regolarizzazione
  •  Convolutional Neural Network (CNN)
  •  Recurrent Neural Network

4 – Unsupervised Learning:

  •  Maximum Likelihood Estimation (MLE)
  •  Restricted Boltzmann machine
  •  (Variational) Autoencoders (VAE)
  •  Generative adversarial networks (GANs)

Testi/Bibliografia

Letture Necessarie:

Appunti delle lezioni

Testi consigliati:

  1. Calcolo scientifico. Esercizi e problemi risolti con MATLAB e Octave, A. Quarteroni et al., Springer Verlag (2017)
  2. Data-driven modeling & scientific computation: methods for complex systems & big data, J. N. Kutz, Oxford University Press (2013)
  3. Probabilistic Machine Learning: An Introduction, K. P. Murphy, The MIT Press (2022)
  4. Lecture Notes: Machine Learning for the Sciences, T. Neupert et al., arXiv:2102.04883v2 (2022)
  5. Modern applications of machine learning in quantum sciences, A. Dawid et al., arXiv:2204.04198 (2022)

Metodi didattici

Lezioni frontali alla lavagna e frequentazione dei laboratori informatici.

In considerazione della tipologia di attività e dei metodi didattici adottati, la frequenza di questa attività formativa richiede la preventiva partecipazione di tutti gli studenti ai moduli 1 e 2 di formazione sulla sicurezza nei luoghi di studio, in modalità e-learning.

Modalità di verifica e valutazione dell'apprendimento

La valutazione dell’apprendimento del corso di Data Science è finalizzata a verificare il raggiungimento degli obiettivi formativi, declinati in termini di conoscenze (sapere) e abilità (saper fare), come previsto dal quadro “Conoscenze e abilità da conseguire”. La verifica si compone di due prove, che concorrono entrambe in misura paritaria alla determinazione del voto finale:

  1. Valutazione delle relazioni di laboratorio (50%)
    La partecipazione ai laboratori è parte integrante del percorso formativo e costituisce un'opportunità fondamentale per acquisire competenze pratiche (saper fare) nell’analisi dei dati, nella programmazione e nell’utilizzo di strumenti e tecniche proprie della Data Science.
    Durante il corso verranno proposte attività di laboratorio guidate, al termine delle quali lo studente dovrà redigere relazioni individuali (secondo le istruzioni fornite di volta in volta dal docente), contenenti la descrizione delle attività svolte, i risultati ottenuti e un commento critico.
    Le relazioni dovranno essere consegnate entro le scadenze comunicate dal docente, generalmente prima della sessione d’esame. Il mancato rispetto delle scadenze può compromettere la valutazione.
    La valutazione delle relazioni si basa su:

    • completezza e accuratezza nell’esecuzione dei compiti assegnati;

    • correttezza dell’analisi e interpretazione dei dati;

    • capacità di comunicare i risultati in modo chiaro, strutturato e pertinente;

    • padronanza degli strumenti utilizzati.
      Il punteggio ottenuto in questa parte contribuisce per il 50% al voto finale.

  2. Esame orale sui contenuti del corso (50%)
    L’esame orale ha lo scopo di verificare l’acquisizione delle conoscenze teoriche e la capacità di collegarle alle attività pratiche svolte durante il corso. In particolare, verranno valutati:

    • comprensione dei concetti fondamentali della Data Science (es. statistica, machine learning, data cleaning, visualizzazione);

    • capacità di argomentazione critica;

    • capacità di sintesi e chiarezza espositiva;

    • eventuali approfondimenti individuali.
      L’orale si svolge solo dopo la consegna e valutazione positiva delle relazioni di laboratorio, in quanto la parte teorico-pratica rappresenta un prerequisito per sostenere la parte teorica.
      Il punteggio ottenuto nella prova orale contribuisce per il 50% al voto finale.
      Durante l’orale non è consentito l’uso di appunti, libri o dispositivi elettronici.

Criteri di valutazione e attribuzione del voto finale

Il voto finale in trentesimi è calcolato come media ponderata (50%+50%) tra la valutazione delle relazioni di laboratorio e l’esame orale. La lode potrà essere attribuita in presenza di eccellenza dimostrata in entrambe le componenti.

La graduazione del voto riflette il seguente schema orientativo:

  • <18: conoscenze e/o competenze insufficienti, mancato raggiungimento degli obiettivi minimi.

  • 18–21: conoscenze e abilità minime raggiunte; esposizione elementare.

  • 22–24: competenze soddisfacenti, esposizione corretta e argomentata.

  • 25–27: buona padronanza dei contenuti, autonomia e capacità di applicazione.

  • 28–30: padronanza approfondita, esposizione chiara e articolata, ottima capacità critica.

  • 30 e lode: eccellenza, partecipazione attiva, capacità di approfondimento autonomo.

Frequenza alle lezioni

La frequenza non è obbligatoria, ma è fortemente consigliata, in particolare per i laboratori, in quanto le attività pratiche sono fondamentali per acquisire le competenze operative richieste.

Tipologia di prova e natura della valutazione
  • Il corso prevede una valutazione con voto in trentesimi.

  • Le prove coprono sia conoscenze teoriche (sapere) sia abilità pratiche (saper fare), in coerenza con gli obiettivi formativi del corso.

Iscrizione alla prova d’esame

Per sostenere l’esame orale è obbligatoria l’iscrizione tramite la piattaforma ufficiale di ateneo (AlmaEsami) entro i termini stabiliti. Gli studenti che non avranno consegnato le relazioni nei tempi previsti non potranno accedere alla prova orale.

Studenti/sse con DSA o disabilità temporanee o permanenti: si raccomanda di contattare per tempo l’ufficio di Ateneo responsabile ( https://site.unibo.it/studenti-con-disabilita-e-dsa/it): sarà sua cura proporre agli/lle studenti/sse interessati/e eventuali adattamenti, che dovranno comunque essere sottoposti, con un anticipo di 15 giorni, all’approvazione del/della docente, che ne valuterà l'opportunità anche in relazione agli obiettivi formativi dell'insegnamento.

Strumenti a supporto della didattica

Lavagna, Proiettore, Laboratorio informatico.

Orario di ricevimento

Consulta il sito web di Domenico Di Sante