- Docente: Ida D'Attoma
- Crediti formativi: 10
- SSD: SECS-S/03
- Lingua di insegnamento: Inglese
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Bologna
- Corso: Laurea Magistrale in Statistica, economia e impresa (cod. 8876)
-
dal 16/09/2025 al 11/12/2025
Conoscenze e abilità da conseguire
This course will present the main data mining methods used in knowledge discovery in business employing internal and external data. With an emphasis on data analysis and on the use of a software special attention will be devoted to techniques that help to single out the relationships of interdependence and patterns in business and market research phenomena. Students will learn, hands-on, how to organize and analyse market research data. In particular, at the end of the course students will be able to: - independently run a complete data mining process (from data pre-processing to the interpretation of obtained results); - choose the best suited statistical methodology for the problem at hand; - to critically interpret empirical results.
Contenuti
1. INTRODUZIONE: il pensiero analitico basato sui dati; panoramica sul Data Mining; dai problemi aziendali alle attività di Data Mining; il processo di Data Mining.
2. ESPLORAZIONE E PREPARAZIONE DEI DATI: oggetti e attributi; matrici di dati e loro trasformazioni; pulizia dei dati.
3. SOFTWARE STATISTICI E DI DATA MINING: introduzione a SAS; esercitazione in laboratorio sull’organizzazione dei dati e sulla loro pre-elaborazione utilizzando insiemi di dati reali.
4. ANALISI MULTIDIMENSIONALE DEI DATI E RIDUZIONE DELLA DIMENSIONALITÀ: analisi delle componenti principali e sue varianti (es. PCA dei ranghi); analisi delle corrispondenze multiple. Teoria e pratica con SAS.
5. MISURE DI PROSSIMITÀ: distanza e similarità per dati misti.
6. CLUSTERING: metodi gerarchici, non gerarchici e ibridi; interpretazione dei risultati. Teoria e applicazioni in SAS.
7. PROFILAZIONE: individuazione del comportamento tipico.
8. CO-OCCORRENZE E ASSOCIAZIONI
9. SCORING
10. Causal ML e Laboratorio Avanzato: fondamenti di inferenza causale; applicazione degli algoritmi di causal ML nel contesto della business analytics per il supporto alle decisioni; valutazione di una campagna di marketing utilizzando causal ML in SAS; targeting e interpretazione dei risultati.
Testi/Bibliografia
Il corso è tenuto in lingua inglese, così come i testi di riferimento. Le lezioni si basano su materiale tratto principalmente dai seguenti volumi:
(Obbligatori)
- Tufféry, S. (2011). Data Mining and Statistics for Decision Making. John Wiley & Sons, Ltd. Capitoli: 1-3, 7, 9-10, 12.
Disponibilità: https://sol.unibo.it/SebinaOpac/query/tuffery?context=catalogo
- Hernán M.A., Robins J.M. (2020). Causal Inference: What If. Boca Raton: Chapman & Hall/CRC.
Disponibile gratuitamente su: https://www.hsph.harvard.edu/miguelhernan/causal-inference-book/
(Letture consigliate)
- Becker S.O., Ichino A. (2002), Estimation of average treatment effects based on propensity scores, The Stata Journal, 2(4), 358–377.
- Dehejia R.H., Wahba S. (1999), Causal effects in nonexperimental studies: reevaluating the evaluation of training programs, Journal of the American Statistical Association, 94, 1053–1062.
- Dehejia R.H., Wahba S. (2002), Propensity score matching methods for nonexperimental causal studies, The Review of Economics and Statistics, 84(1), 151–161.
Materiale aggiuntivo (slide, esercizi, dati, letture di approfondimento) sarà caricato sulla piattaforma e-learning di Ateneo https://virtuale.unibo.it prima di ogni lezione.
Metodi didattici
- Le lezioni frontali prevedono la presentazione di contenuti teorici e applicati relativi ai vari metodi di data mining.
- Le applicazioni vengono introdotte e replicate durante la sessione di laboratorio informatico utilizzando il software statistico SAS, con applicazioni su insiemi di dati reali di tipo aziendale.
- Gli studenti sono invitati a risolvere casi di studio empirici. I casi da svolgere a casa facoltativamente serviranno a rafforzare i concetti del corso e a familiarizzare con l'analisi e l'interpretazione dei dati. Lo svolgimento di casi di studio non sarà oggetto di valutazione. Le soluzioni (o semplicemente un feedback del docente) saranno fornite per l'autovalutazione.
- In considerazione della tipologia di attività e dei metodi didattici adottati, la frequenza di questa attività formativa richiede la preventiva partecipazione di tutti gli studenti ai Moduli 1 e 2 di formazione sulla sicurezza nei luoghi di studio, [https://elearning-sicurezza.unibo.it/] in modalità e-learning.
Modalità di verifica e valutazione dell'apprendimento
Gli studenti, frequentanti e non frequentanti, dovranno sostenere un esame scritto articolato in domande aperte sui contenuti teorici (40% del voto finale) e in una sezione che richiede la produzione e/o l’interpretazione di risultati statistici (60% del voto finale).
La sezione delle domande aperte ha l’obiettivo di verificare la conoscenza da parte dello studente della terminologia e dei concetti fondamentali relativi ai metodi di data mining applicati all’analisi dei dati aziendali, dei punti di forza e dei limiti di ciascun metodo, nonché delle tecniche più adatte per affrontare diversi tipi di dati e problemi di business.
La parte applicativa mira invece a valutare la capacità di produrre e interpretare risultati statistici, traducendoli in conclusioni rilevanti in un contesto aziendale.
Durante il corso saranno messi a disposizione esempi di domande d’esame.
Tutti gli studenti dovranno affrontare prove della stessa difficoltà e durata. L’esame ha una durata di 2 ore e consiste in due domande aperte e 2 o 3 esercizi pratici da svolgere con il software SAS. I punti attribuiti a ciascuna domanda saranno indicati nella traccia d’esame.
Il voto finale è espresso in trentesimi. L’esame si svolge a libro chiuso: non è consentita la consultazione di materiali didattici o fonti teoriche durante lo svolgimento della prova.
Lo studente potrà scegliere se affrontare gli esami parziali durante il corso e/o l'esame totale. Il primo esame parziale riguarda le prime 30 ore del corso ; il secondo parziale riguarda la seconda parte del corso e si svolge durante il primo appello totale. Le date degli appelli totali e parziali sono pubblicate nell'applicativo AlmaEsami.
Scala di valutazione
La valutazione dell'esame intermedio e finale si baserà sulla seguente griglia:
<18 (bocciato)
18-23 (sufficiente): preparazione sufficiente ma relativa a un numero limitato di contenuti del corso;
24-27 (buono): preparazione adeguata ma con alcune lacune rispetto ai contenuti del corso;
28-30 (ottimo): conoscenza molto approfondita di tutti i contenuti del corso;
30 e lode (eccellente): ottima conoscenza dei contenuti del corso.
Strumenti a supporto della didattica
La piattaforma e-learning di UNIBO (VIRTUALE) sarà utilizzata per condividere il materiale didattico e per assegnare agli studenti i compiti periodici a casa. Il materiale didattico comprende:
- Appunti delle lezioni che riassumono gli argomenti teorici spiegati a lezione
- Dati aperti e appunti delle lezioni per seguire le sessioni pratiche
- Miscellanea: esercizi, soluzioni ai compiti, esempi di esami, materiali di follow-up.
- Software SAS on Demand (https://www.sas.com/en_us/software/on-demand-for-academics.html)
Orario di ricevimento
Consulta il sito web di Ida D'Attoma
SDGs

L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.