- Docente: Luis Alberto Barron Cedeno
- Crediti formativi: 6
- SSD: INF/01
- Lingua di insegnamento: Inglese
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Forli
-
Corso:
Laurea Magistrale in
Specialized translation (cod. 6826)
Valido anche per Laurea Magistrale in Specialized translation (cod. 9174)
-
dal 29/09/2025 al 17/12/2025
Conoscenze e abilità da conseguire
Lo/a studente/ssa conosce i principi teorici di base del trattamento automatico delle lingue o Natural Language Processing (NLP); è capace di svolgere compiti basilari del NLP quali tokenizzazione, vettorizzazione e identificazione delle somiglianze fra testi; è capace di costruire e analizzare corpora per la creazione di modelli predittivi; è capace di applicare modelli supervisionati a problemi tipici del NLP quali topic identification o sentiment analysis.
Contenuti
Mentre i contenuti potrebbero essere (leggermente) adattati in base alle competenze e agli interessi degli studenti, la struttura generale del corso sarà la seguente.
- Introduzione al trattamento automatico della lingua
- Parole e modello spaziale vettoriale
- Naive Bayes
- Vettori di parole
- Dai conteggi al significato
- Formazione e valutazione nell'apprendimento automatico
- Introduzione a LSA
- Introduzione alle reti neurali
- Embeddings di parole
- Dalle rappresentazioni di documenti alle sequenze
- Reti Convoluzionali per il testo
- Reti sequenziali per il testo
- Oltre
(contenuti post-editati dalla traduzione automatica con deepl)
Testi/Bibliografia
- Hobson Lane, Cole Howard, Hannes Hapke (2019). Natural Language Processing in Action Understanding, analyzing, and generating text with Python. Manning Publications.
Optional
- Dirk Hovy (2020). Text Analysis in Python for Social Scientists. Cambridge University Press.
- Kenneth Ward Church. Unix for poets.
- Dan Jurafsky and James H. Martin. Speech and Language Processing (3rd ed. draft) Draft chapters in progress, October 16, 2019
- Steven Bird, Ewan Klein, and Edward Loper. Natural Language Processing with Python.
- Yoav Goldberg. (2017). Neural Network Methods for Natural Language Processing (G. Hirst, ed.). Morgan & Claypool Publishers.
- Emily M. Bender (2013). Linguistic Fundamentals for Natural Language Processing: 100 Essentials from Morphology and Syntax Synthesis Lectures on Human Language Technologies. Morgan & Claypool Publishers.
Metodi didattici
Il corso sarà una combinazione di seminari e sessioni pratiche. In entrambi i casi è prevista la partecipazione attiva degli studenti. Il quadrimestre precedente si è fatto un corso d'introduzione alla programmazione con Python.
Requisiti di partecipazione. Per partecipare a questa attività lo/a studente/ssa deve avere una ragionevole conoscenza della programmazione in python. Il livello raggiunto durante la lezione di Profession-based Research (TraTec) o la lezione Introduction to Computer Programming (SpecTra) dovrebbe essere sufficiente per affrontare i concetti trattati in questa attività.
In considerazione della tipologia di attività e dei metodi didattici adottati, la frequenza di questa attività formativa richiede la preventiva partecipazione di tutti gli studenti ai moduli 1 e 2 di formazione sulla sicurezza nei luoghi di studio, in modalità e-learning.
(contenuti post-editati dalla traduzione automatica con deepl e la riformulazione con Llama 3.2)
Modalità di verifica e valutazione dell'apprendimento
- 80% progetto finale
- 20% compiti
La valutazione finale sarà calcolata considerando la qualità della relazione e dell'orale. La relazione deve essere presentata una settimana prima dell'esame, al più tardi.
Modalità di valutazione
- 30-30L: Conoscenza approfondita dell'argomento, eccezionale capacità di applicare i concetti. La/o studente(ssa) esegue rigorosi esperimenti formali e produce una relazione eccezionale, di qualità paragonabile a una presentazione nell'ambito di una conferenza nazionale nel campo.
- 27-29: Conoscenza approfondita dell'argomento, solida capacità di applicare i concetti e buone capacità analitiche. La/o studente(ssa) esegue buoni esperimenti formali e produce una relazione di alta qualità.
- 24-26: Discreta conoscenza dell'argomento e ragionevole capacità di applicare correttamente i concetti. La/o studente(ssa) esegue alcuni esperimenti ragionevoli e produce una buona relazione.
- 21-23: Conoscenza adeguata, ma non approfondita, dell'argomento e parziale capacità di applicare i concetti. La/o studente(ssa) esegue esperimenti imprecisi e produce una relazione ragionevole.
- 18-20: Conoscenza appena adeguata e solo superficiale dell'argomento che denota scarsa coerenza nell'applicare i concetti. La/o studente(ssa) esegue esperimenti sbagliati e produce una relazione approssimativa.
- < 18 insufficiente: Conoscenza inadeguata dell'argomento, errori significativi nell'applicazione dei concetti. Sia gli esperimenti che la relazione sono di scarsa qualità.
Studentesse e studenti con DSA o disabilità temporanee o permanenti (inclusi gravi problemi di salute che interferiscono con il normale svolgimento degli studi) sono pregati di contattare tempestivamente l’ufficio di Ateneo responsabile (Servizio per gli Studenti con Disabilità e con DSA), possibilmente prima dell’inizio del corso. Nota bene: sarà cura dell’Ufficio preposto proporre alle studentesse e agli studenti interessati eventuali adattamenti, che dovranno comunque essere sottoposti, con un anticipo di almeno 15 giorni dalla data dell’esame, all’approvazione del docente, che ne valuterà l'opportunità anche in relazione agli obiettivi formativi dell’insegnamento.
Strumenti a supporto della didattica
I seminari si svolgeranno con diapositive e la codifica sarà effettuata con jupyter notebooks. Saranno effettuati esercizi continui.
(contenuti post-editati dalla traduzione automatica con deepl)
Link ad altre eventuali informazioni
https://albarron.github.io/teaching/natural-language-processing/
Orario di ricevimento
Consulta il sito web di Luis Alberto Barron Cedeno