29853 - LINGUISTICA COMPUTAZIONALE (LM)

Scheda insegnamento

  • Docente Fabio Tamburini

  • Crediti formativi 9

  • SSD L-LIN/01

  • Lingua di insegnamento Italiano

SDGs

L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.

Istruzione di qualità Partnership per gli obiettivi

Anno Accademico 2018/2019

Conoscenze e abilità da conseguire

Lo studente possiede una conoscenza approfondita delle tecniche per il trattamento automatico del linguaggio naturale. E' abile nella creazione, annotazione e sfruttamento di corpora elettronici

Contenuti

Introduzione

  • Natural Language Processing - Problemi e prospettive
  • Breve ripasso di Linguistica dei Corpora
  • Modelli probabilistici, n-grammi

Trattamento automatico delle lingue

  • Tecniche di machine learning.
  • Metodologie per la valutazione dei prodotti della Linguistica Computazionale.
  • I livelli di analisi linguistica da un punto di vista computazionale.
    • FONETICA COMPUTAZIONALE
      • Caratteristiche del campione audio - foni e formanti - parametri significativi
      • Analisi in frequenza – Spettrogrammi – Tratti soprasegmentali
      • Applicazioni per l'elaborazione automatica della lingua parlata.
    • MORFOLOGIA COMPUTAZIONALE
      • Generazione e analisi morfologica. Lemmari
      • Metodologie basate su Automi a Stati Finiti (FSA).
    • SINTASSI COMPUTAZIONALE
      • Part-of-speech tagging
      • Grammatiche per il linguaggio naturale
      • Parsing del linguaggio naturale - metodologie e problematiche
      • Approfondimento: Grammatiche formali per l'analisi della lingua
        • Linguaggi formali e linguaggio naturale. Grammatiche context-free
        • La complessità del linguaggio naturale
        • Grammatiche a Dipendenze
        • Treebank
    • SEMANTICA COMPUTAZIONALE
      • Semantica lessicale: WordNet, FrameNet...
      • Word Sense Disambiguation
      • Modelli lessico-semantici distribuzionali
      • Cenni di semantica della frase

Applicazioni - Case Studies:
  • Case study: identificazione automatica della prominenza prosodica
  • Dialettometria
  • Stilometria

Testi/Bibliografia

Capitoli tratti dai seguenti volumi:
- Lenci, A., Montemagni, S. and Pirrelli, V. (2005). Testo e computer. Carocci.
- D. Jurafsky and J.H. Martin (2008). Speech and Language Processing, 2nd ed., Prentice Hall.
- A. Clark, C. Fox, S. Lappin (2010). The Handbook of Computational Linguistics and Natural Language Processing, Blackwell Handbooks in Linguistics.
Slide, dispense e articoli scaricabili direttamente dal sito web del corso http://corpora.ficlit.unibo.it/LingCompLM/ .

Si raccomanda agli studenti NON frequentanti di contattare il docente, in orario di ricevimento, prima di iniziare lo studio in modo da ricevere tutte le spiegazioni riguardanti i materiali da studiare per l'esame ed evitare così ogni fraintendimento o problema.

Metodi didattici

Il corso di svolge in aula e laboratorio. Comprende circa 30 ore di lezione e esercitazioni in laboratorio.

Modalità di verifica dell'apprendimento

L'esame consiste in un colloquio orale sul programma d'esame atto a valutare le capacità critiche e le conoscenze metodologiche maturate dallo studente.
Il raggiungimento da parte dello studente di una visione organica dei temi affrontati a lezione, la dimostrazione del possesso di una padronanza espressiva e di linguaggio specifico saranno valutati con voti di eccellenza. La conoscenza per lo più meccanica e/o mnemonica della materia, capacità di sintesi e di analisi non articolate e/o un linguaggio corretto ma non sempre appropriato porteranno a valutazioni discrete; lacune formative e/o linguaggio inappropriato – seppur in un contesto di conoscenze minimali del materiale d'esame - condurranno a voti che non supereranno la sufficienza. Lacune formative, linguaggio inappropriato, mancanza di orientamento all'interno degli argomenti discussi durante il corso non potranno che essere valutati negativamente.

E' obbligatorio iscriversi all'esame utilizzando la procedura online [https://almaesami.unibo.it/almaesami/welcome.htm] .

Strumenti a supporto della didattica

Il sito web del corso è stato progettato per essere il fulcro degli strumenti didattici. Contiene la maggior parte dei materiali didattici in formato elettronico, un'indicazione di tutte le procedure e le modalità di erogazione del corso, nonché una ricca raccolta di software del settore.

E' stato inoltre predisposto un CD-ROM a disposizione degli studenti contenente un ambiente di lavoro completo per sperimentare le metodologie proposte nel corso. Questo strumento verrà utilizzato anche nelle esercitazioni in laboratorio.

Orario di ricevimento

Consulta il sito web di Fabio Tamburini