34549 - ELABORAZIONE DEL LINGUAGGIO NATURALE

Anno Accademico 2013/2014

  • Docente: Fabio Tamburini
  • Crediti formativi: 6
  • SSD: INF/01
  • Lingua di insegnamento: Italiano
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Bologna
  • Corso: Laurea Magistrale in Scienze di internet (cod. 8031)

Conoscenze e abilità da conseguire

Al termine del modulo, lo studente conosce le principali problematiche relative al riconoscimento del linguaggio naturale e alla sua implementazione. È in grado di realizzare analizzatori sintattici di parti semplici del linguaggio naturale.

Contenuti

  1. Introduzione - Natural Language Processing: Problemi e prospettive - Cenni di calcolo delle probabilità - Modelli di Markov - Cenni di Teoria dell'Informazione - Tecniche di clustering.
  2. I Corpora - Costruzione, rappresentatività del campione - Text retrieval - Concordanze, collocazioni e indici di associazione lessicale. 
  3. Fonetica computazionale - Caratteristiche del campione audio, foni e formanti, parametri significativi - Analisi in frequenza, Trasformata di Fourier, Spettrogrammi - Linear Predictive Coding. Speech recognition, Speaker diarisation and identification.  
  4. Morfologia computazionale - Generazione e analisi morfologica, Lemmari - Finite State Automata and Transducers.
  5. Sintassi computazionale - Part of speech tagging - Grammatiche per il linguaggio naturale - Parsing del linguaggio naturale: metodologie e problematiche - Cenni di formalismi HPSG e Grammatiche Categoriali.  
  6. Semantica computazionale - Semantica lessicale, WordNet - Word Sense Disambiguation, Distributional Semantic Model - Semantica della frase, Lambda calcolo e Grammatiche di Montague - Semantica e Grammatiche Categoriali.

Testi/Bibliografia

 Capitoli tratti dai seguenti volumi (come indicato nel sito del corso):
- D. Jurafsky and J.H. Martin (2008). Speech and Language Processing, Prentice Hall.
- C. Manning and H. Schütze (1999). Foundations of Statistical Natural Language Processing, MIT Press.
- A. Clark, C. Fox, S. Lippin (2010). The Handbook of Computational Linguistics and Natural Language Processing, Blackwell.
- L. Rabiner and B. Juang (1993). Fundamentals of Speech Recognition, Prentice Hall.
- Slide, dispense e articoli scaricabili direttamente dal sito web del corso http://corpora.ficlit.unibo.it/NLP/

Metodi didattici

Il corso di svolge interamente in aula e comprende circa 36 ore di lezione frontale, con eventuali esercitazioni in classe.

Modalità di verifica e valutazione dell'apprendimento

L'esame consisterà in un progetto da sviluppare in laboratorio, singolarmente o in coppia con un altro studente, preventivamente concordato col docente. La discussione del progetto sarà integrata da una prova orale con domande sul programma d'esame. Sia il progetto che la prova orale verificheranno il raggiungimento degli obiettivi didattici del corso:
- conoscenza delle principali problematiche relative al trattamento e al riconoscimento del linguaggio naturale;
- conoscenza delle principali soluzioni, e relative implementazioni, per i principali problemi relativi al trattamento automatico delle lingue;

Per sostenere gli esami è necessario accordarsi col docente e definire data e ora della prova. Non verranno fissati appelli, ma sarà data agli studenti la possibilità di sostenere l'esame su appuntamento.

Strumenti a supporto della didattica

Il sito web del corso (http://corpora.ficlit.unibo.it/NLP) è stato progettato per essere il fulcro degli strumenti didattici. Contiene la maggior parte dei materiali didattici in formato elettronico, un'indicazione di tutte le procedure e le modalità di erogazione del corso, nonché una ricca raccolta di software del settore, utile anche per l'esecuzione dei progetti di laboratorio.

Link ad altre eventuali informazioni

http://corpora.ficlit.unibo.it/NLP

Orario di ricevimento

Consulta il sito web di Fabio Tamburini