- Docente: Fabio Tamburini
- Crediti formativi: 6
- SSD: L-LIN/01
- Lingua di insegnamento: Italiano
- Modalità didattica: Convenzionale - Lezioni in presenza
- Campus: Bologna
-
Corso:
Laurea Magistrale in
Semiotica (cod. 8886)
Valido anche per Laurea Magistrale in Italianistica, culture letterarie europee, scienze linguistiche (cod. 0973)
Laurea Magistrale in Language, society and communication / lingua, società e comunicazione (cod. 8874)
Conoscenze e abilità da conseguire
Lo studente al termine del corso acquisisce competenze modellistico-tecnologiche e metodologiche per il trattamento automatico delle lingue.
Contenuti
Introduzione
- Natural Language Processing - Problemi e prospettive
- Breve ripasso di Linguistica dei Corpora
- Modelli probabilistici
- Modelli delle lingue a n-grammi
Trattamento automatico delle lingue
- Tecniche di machine learning.
- Metodologie per la valutazione dei prodotti della Linguistica Computazionale.
- I livelli di analisi linguistica da un punto di vista computazionale.
- FONETICA COMPUTAZIONALE
- Caratteristiche del campione audio - foni e formanti - parametri significativi
- Analisi in frequenza – Spettrogrammi – Tratti soprasegmentali
- Applicazioni per l'elaborazione automatica della lingua parlata.
- MORFOLOGIA COMPUTAZIONALE
- Generazione e analisi morfologica. Lemmari
- Metodologie basate su Automi a Stati Finiti (FSA).
- SINTASSI COMPUTAZIONALE
- Part-of-speech tagging
- Grammatiche per il linguaggio naturale
- Parsing del linguaggio naturale - metodologie e problematiche
- Approfondimento: Grammatiche formali per l'analisi della lingua
- Linguaggi formali e linguaggio naturale. Grammatiche context-free
- La complessità del linguaggio naturale
- Grammatiche a Dipendenze
- Treebank
- SEMANTICA COMPUTAZIONALE
- Semantica lessicale: WordNet, FrameNet...
- Word Sense Disambiguation
- Modelli lessico-semantici distribuzionali
- Cenni di semantica della frase
- Case study: identificazione automatica della prominenza prosodica
- Dialettometria
- Stilometria
Testi/Bibliografia
Capitoli tratti dai seguenti volumi:
- Lenci, A., Montemagni, S. and Pirrelli, V. (2005). Testo e
computer. Carocci.
- D. Jurafsky and J.H. Martin (2008). Speech and Language
Processing, 2nd ed., Prentice Hall.
- A. Clark, C. Fox, S. Lappin (2010). The Handbook of Computational
Linguistics and Natural Language Processing, Blackwell Handbooks in
Linguistics.
Slide, dispense e articoli scaricabili direttamente dal sito web
del corso http://corpora.ficlit.unibo.it/LingCompLM/.
Si raccomanda agli studenti NON frequentanti di contattare
il docente, in orario di ricevimento, prima di iniziare lo studio
in modo da ricevere tutte le spiegazioni riguardanti i materiali da
studiare per l'esame ed evitare così ogni fraintendimento o
problema.
Metodi didattici
Il corso di svolge in aula e laboratorio. Comprende circa 30 ore di
lezione e esercitazioni in laboratorio.
Modalità di verifica e valutazione dell'apprendimento
L'esame consiste in un colloquio orale sul programma d'esame atto a
valutare le capacità critiche e le conoscenze metodologiche
maturate dallo studente.
Il raggiungimento da parte dello studente di una visione organica
dei temi affrontati a lezione, la dimostrazione del possesso di una
padronanza espressiva e di linguaggio specifico saranno valutati
con voti di eccellenza. La conoscenza per lo più meccanica e/o
mnemonica della materia, capacità di sintesi e di analisi non
articolate e/o un linguaggio corretto ma non sempre appropriato
porteranno a valutazioni discrete; lacune formative e/o linguaggio
inappropriato – seppur in un contesto di conoscenze minimali del
materiale d'esame - condurranno a voti che non supereranno la
sufficienza. Lacune formative, linguaggio inappropriato, mancanza
di orientamento all'interno degli argomenti discussi durante il
corso non potranno che essere valutati negativamente.
E' obbligatorio iscriversi all'esame utilizzando la procedura online.
Strumenti a supporto della didattica
Il sito web del corso è stato progettato per essere il fulcro degli
strumenti didattici. Contiene la maggior parte dei materiali
didattici in formato elettronico, un'indicazione di tutte le
procedure e le modalità di erogazione del corso, nonché una ricca
raccolta di software del settore.
E' stato inoltre predisposto un CD-ROM a disposizione degli
studenti contenente un ambiente di lavoro completo per sperimentare
le metodologie proposte nel corso. Questo strumento verrà
utilizzato anche nelle esercitazioni in laboratorio.
Link ad altre eventuali informazioni
http://corpora.ficlit.unibo.it/LingCompLM/
Orario di ricevimento
Consulta il sito web di Fabio Tamburini