78830 - METODI STATISTICI MULTIVARIATI PER IL CREDIT SCORING

Anno Accademico 2024/2025

  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Rimini
  • Corso: Laurea in Statistica, finanza e assicurazioni (cod. 5901)

Conoscenze e abilità da conseguire

Al termine del corso lo studente: - conosce i concetti fondamentali delle metodologie statistiche per le decisioni aziendali e finanziarie; - conosce i modelli per dati contabili e finanziari più adeguati per individuare e misurare il rischio di credito.

Contenuti

  • Introduzione ai metodi statistici per il credit scoring.
  • Richiami sulle variabili categoriali: indipendenza marginale e condizionata, misure di associazione.
  • Modello di regressione logistica: formulazione del modello, stima e interpretazione dei parametri, selezione delle variabili, bontà di adattamento.
  • Analisi discriminante: analisi discriminante canonica e basata su modello.
  • Alberi di classificazione: metodi CART e CHAID.
  • Metodi per la stima del tasso di errata classificazione e per la valutazione della performance del classificatore.
  • Aspetti principali delle reti neurali.
  • Cenni ai modelli a variabili latenti: analisi delle classi latenti.
  • Richiami all'analisi dei gruppi per il suo utilizzo nel credit scoring

Per ognuno degli argomenti elencati verranno svolte analisi di casi di studio in laboratorio utilizzando il software R (almeno 2 ore a settimana).

Testi/Bibliografia

Materiale necessario

  • Elena Stanghellini (2009) "Introduzione ai metodi statistici per il credit scoring", Springer-Verlag. Disponibile come e-book di ateneo.
  • Dispense del docente disponibili nella piattaforma Virtual Learning Environment al link: virtuale.unibo.it

Testi consigliati

  • Stefania Mignani, Angela Montanari (1997) "Appunti di analisi statistica multivariata", Esculapio (cap. 5 analisi discriminante, cap. 7 analisi dei gruppi)
  • Sergio Zani, Andrea Cerioli (2007) "Analisi dei dati e data mining per le decisioni aziendali", Giuffrè Editore (cap. 8 distanze e indici di similarità, cap. 9 analisi dei gruppi, cap. 11 alberi di classificazione, cap. 12 reti neurali)

Metodi didattici

Lezioni frontali in aula ed esercitazioni in laboratorio statistico utilizzando il software R - Rstudio (lavoro individuale seguendo gli esempi trattati dal docente o lavoro di gruppo).

La frequenza alle lezioni, pur non essendo obbligatoria, è fortemente raccomandata.

In considerazione della tipologia di attività e dei metodi didattici adottati, la frequenza di questa attività formativa richiede la preventiva partecipazione di tutti gli studenti ai moduli 1 e 2 di formazione sulla sicurezza nei luoghi di studio in modalità e-learning.

Modalità di verifica e valutazione dell'apprendimento

Prova complessiva scritta volta a valutare la conoscenza dei metodi statistici affrontati durante il corso sia dal punto di vista teorico sia da quello applicato. Non sono previste prove parziali.

La prova scritta consiste in domande aperte riguardanti sia la teoria sia l'interpretazione di output prodotti con il software R. Nel materiale didattico del docente sarà possibile visionare un esempio di prova scritta. La prova scritta ha una durata di 2 ore. Durante la prova scritta è consentito esclusivamente l'uso della calcolatrice.

Per ogni domanda è indicato il punteggio attribuito. La somma dei punteggi è pari a 32. Il voto finale è espresso in trentesimi e viene calcolato tramite la somma dei punteggi ottenuti nelle single domande. La lode viene assegnata solo agli studenti che ottengono un punteggio pari a 32.

Il voto finale corrisponde alla seguente descrizione del livello di preparazione complessiva raggiunta:

< 18: insufficiente (esame non superato)

18-23: sufficiente

24-25: discreto

26-28: buono

29-30: ottimo

30 e lode: eccellente

Durante le lezioni verranno proposte delle attività di gruppo finalizzate all'analisi di un dataset e all'interpretazione dei risultati che, se portate a termine, verranno valutate fino a 2 punti da aggiungere al punteggio ottenuto alla prova scritta. Ulteriori dettagli verranno forniti durante le lezioni. Coloro che non frequentano le lezioni possono contattare la docente per avere informazioni circa un'attività alternativa da svolgere (presentazione o breve tesina sempre basata sull'analisi di un dataset) che andrà consegnata almeno 10 giorni prima dell'esame.

Conoscenze adeguate di matematica, statistica, calcolo delle probabilità e inferenza statistica, costituiscono prerequisiti fondamentali per affrontare l’esame con successo.

Strumenti a supporto della didattica

Slide e materiale di laboratorio disponibili sulla piattaforma Virtuale; software R- Rstudio.

Orario di ricevimento

Consulta il sito web di Mariagiulia Matteucci

SDGs

Istruzione di qualità Lavoro dignitoso e crescita economica

L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.