85302 - DATA SCIENCE

Anno Accademico 2020/2021

  • Docente: Laura Anderlucci
  • Crediti formativi: 6
  • SSD: SECS-S/01
  • Lingua di insegnamento: Inglese
  • Moduli: Laura Anderlucci (Modulo 1) Laura Anderlucci (Modulo 2)
  • Modalità didattica: Convenzionale - Lezioni in presenza (Modulo 1) Convenzionale - Lezioni in presenza (Modulo 2)
  • Campus: Bologna
  • Corso: Laurea in Genomics (cod. 9211)

Conoscenze e abilità da conseguire

Al termine del corso, lo studente conosce i metodi correnti delle tecniche applicati ai data-science usando metodi e software computazionali moderni con una particolare enfasi sul ragionamento rigoroso in statistica. Lo studente è capace di rappresentare e organizzare le conoscenze riguardo a collezioni di dati su larga scala, trasformare i dati in informazioni pratiche usando concetti di "statistical learning" e " data mining" combinati con le tecniche di visualizzazione dei dati e di riproducibilità delle analisi dei dati.

Contenuti

Part 0: Introduction to Statistical Learning

Part I: Classification

  • Naïve Bayes
  • Logistic Regression;
  • Linear Discriminant Analysis
  • k-Nearest Neighbors

Part II: Resampling Methods

  • Cross-Validation
  • The Bootstrap

Part III: Tree-Based Methods

  • Classification trees
  • Bagging; Random Forests; Boosting

Part IV: Unsupervised Learning

  • k-means
  • Hierarchical clustering

Part V: Overview of the main machine learning methods

  • Support Vector Machines
  • Neural Networks

Testi/Bibliografia

The primary text for the course:

In addition, we will use:

Metodi didattici

Lectures and practical sessions.

Modalità di verifica e valutazione dell'apprendimento

Written exam.

Strumenti a supporto della didattica

The following material will be provided: slides of the lectures, exercises with solutions, mock exam.

Orario di ricevimento

Consulta il sito web di Laura Anderlucci