90909 - WORKSHOP 2 (WS7)

Anno Accademico 2021/2022

  • Docente: Elena Morotti
  • Crediti formativi: 4
  • Lingua di insegnamento: Italiano
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Bologna
  • Corso: Laurea Magistrale in Politica, amministrazione e organizzazione (cod. 9085)

    Valido anche per Laurea Magistrale in International relations (cod. 9084)

Conoscenze e abilità da conseguire

The course aims at introducing students to the utilization of one of the main statistical packages for data analysis and presenting to them the basic elements of micro-data management and analysis. By the end of the course students will be familiar with the statistical package interface and be able to: load different types of data and different file formats into the statistical package, perform basic data management operations and conduct monovariate and multivariate statistical analyses using the software introduced during the course.

Contenuti

BIG DATA TECHNIQUES WITH R, parte II

Questo workshop copre le tecniche di apprendimento automatico per la classificazione e il clustering, con un focus speciale sulle loro applicazioni per il Text Mining.

Più nel dettaglio:

  • Algoritmi di kNN, SVM e regressione logistica per la classificazione;
  • Algoritmi di k-means, mean-shift clustering e clustering gerarchico;
  • Tecniche di pre-processing per dati testuali;
  • Tecniche ed algoritmi per il Text Mining;
  • Applicazione del Text Mining.

Testi/Bibliografia

James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to statistical learning (Vol. 112, p. 18). New York: springer.

Slide del docente

Metodi didattici

Lezioni frontali (se permesso dalle normative) 

Modalità di verifica e valutazione dell'apprendimento

Valutazione di un progetto finale

Strumenti a supporto della didattica

Slide del docente

Orario di ricevimento

Consulta il sito web di Elena Morotti