40720 - DATA MINING

Anno Accademico 2020/2021

  • Docente: Ida D'Attoma
  • Crediti formativi: 6
  • SSD: SECS-S/03
  • Lingua di insegnamento: Inglese
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Forli
  • Corso: Laurea Magistrale in Economia e management (cod. 9203)

    Valido anche per Laurea Magistrale in Economia e management (cod. 9203)

Conoscenze e abilità da conseguire

This course will present main statistical methods used in knowledge discovery in business databases; special attention will be paid to techniques that help to single out the relationships of interdependence and patterns in business phenomena. In particular, this course seeks to enable the student: - to correctly plan a data mining process; - to choose the best suited statistical methodology for the problem at hand; - to critically interpret empirical results; - to use these results in the business decision process.

Contenuti

  1. Introduzione: cosa è il data mining.

  2. Organizzazione dei dati: matrici e loro trasformazioni.

  3. Preparazione ed analisi esplorativa bivariata di dati qualitativi e quantitativi.

  4. Misure di prossimità: distanza e similarità.

  5. Analisi di raggruppamento: cluster analysis gerarchica e non gerarchica.

  6. Previsione e classificazione: regressione logistica.

Testi/Bibliografia

Il corso è tenuto in lingua inglese ed il testo di riferimento è in lingua inglese. Le lezioni saranno basate su materiale tratto principalmente dal seguente volume:

  • Tufféry, S. (2011) Data Mining and Statistics for Decision Making. John Wiley & Sons, Ltd. (Necessario

Il libro di testo è presente:

  • nel catalogo della biblioteca centrale Roberto Ruffilli-Campus di Forlì. E' possibile verificare se disponibile al seguente link: http://sol.unibo.it/SebinaOpac/Opac?sysb=&fromBiblio=
  • nel catalogo del polo bolognese del servizio bibliotecario nazionale. E' possibile verificare se disponibile al seguente link:http://sol.unibo.it/SebinaOpac/Opac

Verranno altresì forniti lucidi  sulla piattaforma e-learning prima di ogni lezione. Ulteriore materiale bibliografico di approfondimento sarà indicato dal docente durante le lezioni.

Metodi didattici

Il corso è strutturato in lezioni frontali che riguarderanno la presentazione di argomenti teorici e attività di esercitazione nel laboratorio informatico. Nelle lezioni frontali a carattere teorico-concettuale vengono presentati metodi e strumenti statistici; nelle lezioni di laboratorio di carattere teorico-pratico alcuni dei metodi presentati vengono applicati a dataset relativi a specifici casi di studio in ambito economico-aziendale tramite l'ausilio del software SAS.

Oltre alle lezioni frontali ed alla pratica in laboratorio, verranno usati quiz di comprensione e autovalutazione  in aula e on-line (tramite la piattaforma e-learning di Ateneo).

 

Modalità di verifica e valutazione dell'apprendimento

La prova d'esame è volta ad accertare la conoscenza delle tecniche statistiche e di data mining illustrate durante le lezioni frontali e la capacità di applicare tali strumenti a casi concreti tramite l'utilizzo del software SAS.

Non c'è distinzione tra studenti frequentanti e non frequentanti. La prova è uguale per tutti.

L’accertamento dell’apprendimento prevede una prova scritta composta da una sezione a risposta multipla (1/3 del voto) e da una sezione pratica (2/3 del voto) composta da 2-3 esercizi di interpretazione di output già prodotti o da produrre tramite l’uso del software SAS. La sezione a risposta multipla è volta a verificare la conoscenza teorica degli argomenti trattati nel corso. La sezione pratica è finalizzata alla verifica della capacità di produrre e interpretare i risultati sia dal punto di vista statistico che dal punto di vista decisionale rispetto all’obiettivo della ricerca.

Accedi alla pagina iol del corso per maggiori dettagli.

Strumenti a supporto della didattica

  • Lucidi, note informative, syllabus, domande ed esercizi tipo-esame, test di autovalutazione on-line resi disponibili sulla piattaforma e-learning di Ateneo.
  • Software SAS 9.4 presso i laboratori AULA 5 TH e LABIC
  • Kahoot Software

Orario di ricevimento

Consulta il sito web di Ida D'Attoma

SDGs

Istruzione di qualità

L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.