- Docente: Laura Anderlucci
- Crediti formativi: 6
- SSD: SECS-S/01
- Lingua di insegnamento: Inglese
- Moduli: Laura Anderlucci (Modulo 1) Laura Anderlucci (Modulo 2)
- Modalità didattica: Convenzionale - Lezioni in presenza (Modulo 1) Convenzionale - Lezioni in presenza (Modulo 2)
- Campus: Bologna
- Corso: Laurea in Genomics (cod. 9211)
Conoscenze e abilità da conseguire
Al termine del corso, lo studente conosce i metodi correnti delle tecniche applicati ai data-science usando metodi e software computazionali moderni con una particolare enfasi sul ragionamento rigoroso in statistica. Lo studente è capace di rappresentare e organizzare le conoscenze riguardo a collezioni di dati su larga scala, trasformare i dati in informazioni pratiche usando concetti di "statistical learning" e " data mining" combinati con le tecniche di visualizzazione dei dati e di riproducibilità delle analisi dei dati.
Contenuti
Part 0: Introduction to Statistical Learning
Part I: Classification
- Naïve Bayes
- Logistic Regression;
- Linear Discriminant Analysis
- k-Nearest Neighbors
Part II: Resampling Methods
- Cross-Validation
- The Bootstrap
Part III: Tree-Based Methods
- Classification trees
- Bagging; Random Forests; Boosting
Part IV: Unsupervised Learning
- k-means
- Hierarchical clustering
Part V: Overview of the main machine learning methods
- Support Vector Machines
- Neural Networks
Testi/Bibliografia
The primary text for the course:
- James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to Statistical Learning. New York: Springer.
Freely available at: http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Seventh%20Printing.pdf
In addition, we will use:
- T. Hastie, R. Tibshirani, and J. Friedman (2001) The Elements of Statistical Learning: data mining, inference and prediction. Springer Verlag.
Freely available at: https://web.stanford.edu/~hastie/Papers/ESLII.pdf - J. Han and M. Kamber (2000) Data mining: concepts and techniques. Morgan Kaufman.
Freely available at: http://myweb.sabanciuniv.edu/rdehkharghani/files/2016/02/The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei-Han-Micheline-Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques-3rd-Edition-Morgan-Kaufmann-2011.pdf
Metodi didattici
Lectures and practical sessions.
Modalità di verifica e valutazione dell'apprendimento
Written exam.
Strumenti a supporto della didattica
The following material will be provided: slides of the lectures, exercises with solutions, mock exam.
Orario di ricevimento
Consulta il sito web di Laura Anderlucci