92586 - COMPUTATIONAL LINGUISTICS

Anno Accademico 2020/2021

  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Forli
  • Corso: Laurea Magistrale in Specialized translation (cod. 9174)

Contenuti

Mentre i contenuti potrebbero essere (leggermente) adattati in base alle competenze e agli interessi degli studenti, la struttura generale del corso sarà la seguente.

  1. Introduzione alla linguistica computazionale
  2. Introduzione allo scripting Python
  3. Parole e modello spaziale vettoriale
  4. Naive Bayes
  5. Vettori di parole
  6. Dai conteggi al significato
  7. Formazione e valutazione nell'apprendimento automatico
  8. Corpora
  9. Introduzione a LSA
  10. Introduzione alle reti neurali
  11. Embeddings di parole
  12. Dalle rappresentazioni di documenti alle sequenze
  13. Convoluzioni per il testo
  14. Il testo è sequenziale
  15. Oltre

(contenuti post-editati dalla traduzione automatica con deepl)

Testi/Bibliografia

  1. Hobson Lane, Cole Howard, Hannes Hapke (2019). Natural Language Processing in Action Understanding, analyzing, and generating text with Python. Manning Publications.
  2. Kenneth Ward Church. Unix for poets [https://www.cs.upc.edu/~padro/Unixforpoets.pdf] .

    Optional
  3. Dan Jurafsky and James H. Martin. Speech and Language Processing (3rd ed. draft) Draft chapters in progress [http://web.stanford.edu/~jurafsky/slp3/], October 16, 2019
  4. Steven Bird, Ewan Klein, and Edward Loper. Natural Language Processing with Python. http://www.nltk.org/book/
  5. Yoav Goldberg. (2017). Neural Network Methods for Natural Language Processing (G. Hirst, ed.). Morgan & Claypool Publishers.
  6. Emily M. Bender (2013). Linguistic Fundamentals for Natural Language Processing: 100 Essentials from Morphology and Syntax Synthesis Lectures on Human Language Technologies. Morgan & Claypool Publishers.

Metodi didattici

Il corso sarà una combinazione di seminari e sessioni pratiche. In entrambi i casi è prevista la partecipazione attiva degli studenti. Inizieremo con un'introduzione al linguaggio di programmazione Python e seguiremo con una descrizione (pratica) di diversi modelli e compiti.

La partecipazione ad un minimo del 70% delle lezioni è obbligatoria.

(contenuti post-editati dalla traduzione automatica con deepl)

Modalità di verifica e valutazione dell'apprendimento

Lo studente lavorerà per affrontare una problematica nell'ambito dei propri interessi di ricerca con le conoscenze acquisite durante il corso. Una volta concordato l'argomento, lo studente lavorerà alla soluzione del problema e scriverà una relazione scritta. Alla fine del corso verrà organizzata una sessione di poster in cui gli studenti presenteranno il loro lavoro di ricerca.

La valutazione finale sarà calcolata considerando la qualità della relazione e della presentazione del poster.

Modalità di valutazione

  • 30-30L: Conoscenza approfondita dell'argomento, eccezionale capacità di applicare i concetti. La/o studente(ssa) esegue rigorosi esperimenti formali e produce una relazione eccezionale, di qualità paragonabile a una presentazione nell'ambito di una conferenza nazionale nel campo.
  • 27-29: Conoscenza approfondita dell'argomento, solida capacità di applicare i concetti e buone capacità analitiche. La/o studente(ssa) esegue buoni esperimenti formali e produce una relazione di alta qualità.
  • 24-26: Discreta conoscenza dell'argomento e ragionevole capacità di applicare correttamente i concetti. La/o studente(ssa) esegue alcuni esperimenti ragionevoli e produce una buona relazione.
  • 21-23: Conoscenza adeguata, ma non approfondita, dell'argomento e parziale capacità di applicare i concetti. La/o studente(ssa) esegue esperimenti imprecisi e produce una relazione ragionevole.
  • 18-20: Conoscenza appena adeguata e solo superficiale dell'argomento che denota scarsa coerenza nell'applicare i concetti. La/o studente(ssa) esegue esperimenti sbagliati e produce una relazione approssimativa.
  • < 18 insufficiente: Conoscenza inadeguata dell'argomento, errori significativi nell'applicazione dei concetti. Sia gli esperimenti che la relazione sono di scarsa qualità.

 

 

 

Strumenti a supporto della didattica

I seminari si svolgeranno con diapositive e la codifica sarà effettuata con jupyter notebooks. Saranno effettuati esercizi continui.

(contenuti post-editati dalla traduzione automatica con deepl)


Orario di ricevimento

Consulta il sito web di Luis Alberto Barron Cedeno