96802 - DATA MINING FOR BUSINESS AND MARKET RESEARCH

Anno Accademico 2022/2023

  • Docente: Ida D'Attoma
  • Crediti formativi: 10
  • SSD: SECS-S/03
  • Lingua di insegnamento: Inglese
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Bologna
  • Corso: Laurea Magistrale in Statistica, economia e impresa (cod. 8876)

Conoscenze e abilità da conseguire

This course will present the main data mining methods used in knowledge discovery in business employing internal and external data. With an emphasis on data analysis and on the use of a software special attention will be devoted to techniques that help to single out the relationships of interdependence and patterns in business and market research phenomena. Students will learn, hands-on, how to organize and analyse market research data. In particular, at the end of the course students will be able to: - independently run a complete data mining process (from data pre-processing to the interpretation of obtained results); - choose the best suited statistical methodology for the problem at hand; - to critically interpret empirical results.

Contenuti

1. INTRODUZIONE: il pensiero analitico basato sui dati, panoramica sul Data Mining, dai problemi aziendali alle attività di Data Mining, il processo di Data Mining.

2. ESPLORAZIONE E PREPARAZIONE DEI DATI: oggetti e attributi, matrici di dati e loro trasformazioni, pulizia dei dati.

3. SOFTWARE STATISTICI E DI DATA MINING: introduzione a SAS; esercitazione SAS LAB sull'organizzazione dei dati e sulla loro pre-elaborazione utilizzando insiemi di dati reali.

4. RIDUZIONE DEI DATI: analisi delle componenti principali e sue varianti.

5. MISURE DI PROSSIMITÀ: distanza e similarità.

6. CLUSTERING: metodi gerarchici e non-gerarchici. Comprendere i risultati del clustering.

7. PROFILAZIONE: individuare il comportamento tipico.

8. CO-OCCORRENZE E ASSOCIAZIONI

9. SCORING 

10.Modelli di tipo "look-alike" per la ricerca di nuovi clienti.

Testi/Bibliografia

Il corso è tenuto in lingua inglese ed il testo di riferimento è in lingua inglese. Le lezioni saranno basate su materiale e argomenti tratti principalmente dal seguente volume:

  • (Necessario) Tufféry, S. (2011) Data Mining and Statistics for Decision Making. John Wiley & SOns, Ltd. Capitoli: 1,2,3,7,9,10,12.

    E' possibile controllare la disponibilità al seguente link: https://sol.unibo.it/SebinaOpac/query/tuffery?context=catalogo

Sarà utilizzato anche il seguente volume:

  • (Consigliato) Foster Provost & Tom Fawcett (2013) Data Science for Business. O'Reilly Media, Inc. Capitoli: 1,2,6, 12.

E' possibile controllare la disponibilità al seguente link: https://sol.unibo.it/SebinaOpac/query/data%20science%20 for%20business?bib=UBOST&context=catalogo

Verranno altresì forniti lucidi tramite la piattaforma e-learning di ateneo  https://virtuale.unibo.it/ prima di ogni lezione. Ulteriore materiale bibliografico di approfondimento sarà indicato dal docente durante le lezioni.

Metodi didattici

Le lezioni frontali prevedono la presentazione di contenuti teorici e applicati relativi ai vari metodi di data mining. Dopo ogni sessione teorica, una sessione pratica è dedicata alle applicazioni su insiemi di dati reali.

Le applicazioni vengono introdotte e replicate durante la sessione di laboratorio informatico utilizzando il software statistico SAS.

Gli studenti sono invitati a risolvere e discutere casi di studio empirici. I compiti a casa serviranno a rafforzare i concetti del corso e a familiarizzare con l'analisi e l'interpretazione dei dati. I compiti a casa non saranno valutati. Tuttavia, le soluzioni (o semplicemente un feedback del docente) saranno fornite per l'autovalutazione.

“In considerazione della tipologia di attività e dei metodi didattici adottati, la frequenza di questa attività formativa richiede la preventiva partecipazione di tutti gli studenti ai Moduli 1 e 2 di formazione sulla sicurezza nei luoghi di studio, [https://elearning-sicurezza.unibo.it/] in modalità e-learning.

Modalità di verifica e valutazione dell'apprendimento

Gli studenti frequentanti e non frequentanti dovranno sostenere un esame scritto che consiste in domande aperte sui contenuti teorici (40% del voto finale) e in una sezione che richiede la produzione e/o l'interpretazione di risultati statistici (60% del voto finale). La sezione delle domande aperte mira a verificare la conoscenza degli argomenti teorici da parte dello studente. In particolare, la sessione teorica mira a verificare la conoscenza degli studenti della terminologia e dei concetti principali associati ai metodi di data mining utilizzati per trattare i dati aziendali, i punti di forza e i limiti di ciascun metodo, nonché le tecniche di data mining utilizzate per analizzare diversi tipi di dati e problemi aziendali. La sezione pratica mira a verificare la capacità di produrre e interpretare i risultati statistici e la loro traduzione in conclusioni applicate in un contesto aziendale. Durante il corso verranno messe a disposizione domande tipiche d'esame. Tutti gli studenti dovranno svolgere compiti della stessa difficoltà nello stesso tempo. Si tratta di un esame scritto di 2 ore con due domande aperte sulla teoria e 2/3 esercizi pratici con il software SAS. I punti assegnati per le risposte corrette a ciascuna domanda saranno riportati nella traccia d'esame. Il voto finale è espresso in trentesimi. L'esame è "a libro chiuso". Gli studenti non possono consultare riferimenti e fonti di informazione teorica durante lo svolgimento del compito.

Scala di valutazione

La valutazione dell'esame intermedio e finale si baserà sulla seguente griglia:

<18 (bocciato)

18-23 (sufficiente): preparazione sufficiente ma relativa a un numero limitato di contenuti del corso;

24-27 (buono): preparazione adeguata ma con alcune lacune rispetto ai contenuti del corso;

28-30 (ottimo): conoscenza molto approfondita di tutti i contenuti del corso;

30 e lode (eccellente): ottima conoscenza dei contenuti del corso.

Strumenti a supporto della didattica

La piattaforma e-learning di UNIBO (VIRTUALE) sarà utilizzata per condividere il materiale didattico e per assegnare agli studenti i compiti periodici a casa. Il materiale didattico comprende:

  • Appunti delle lezioni che riassumono gli argomenti teorici spiegati a lezione
  • Dati aperti e appunti delle lezioni per seguire le sessioni pratiche
  • Miscellanea: esercizi, soluzioni ai compiti, esempi di esami, materiali di follow-up.
  • Software SAS on Demand (https://www.sas.com/en_us/software/on-demand-for-academics.html)

Orario di ricevimento

Consulta il sito web di Ida D'Attoma

SDGs

Istruzione di qualità

L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.