96639 - MACHINE TRANSLATION

Anno Accademico 2022/2023

  • Docente: Federico Garcea
  • Crediti formativi: 5
  • SSD: ING-INF/05
  • Lingua di insegnamento: Inglese
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Forli
  • Corso: Laurea Magistrale in Specialized translation (cod. 9174)

Conoscenze e abilità da conseguire

Lo/a studente/ssa conosce la storia, i principi e gli sviluppi più attuali nell’ambito della traduzione automatica; è in grado di concepire, svolgere, gestire e valutare progetti complessi di traduzione automatica, in cui intervengono diverse professionalità e diverse competenze, incluse quelle di pre- e post-editing in diversi registri e lingue di specialità, nel rispetto della deontologia professionale; è in grado di elaborare autonomamente ulteriori conoscenze e competenze di livello superiore nell'ambito della traduzione automatica e di utilizzarle per ottimizzare i processi relativi nell'industria delle lingue.

Contenuti

Il modulo "Traduzione automatica" (MT) si svolge durante il secondo semestre.

In questo corso vengono introdotti i principi chiave della MT, a partire da una breve panoramica delle principali pietre miliari della sua storia, dagli anni '40 fino agli ultimi sviluppi, quindi vengono presentate le principali architetture dei sistemi MT.
Segue uno sguardo approfondito ai fenomeni linguistici e di traduzione che sono particolarmente impegnativi per l'elaborazione della MT, per aumentare la consapevolezza degli studenti, in modo che possano valutare criticamente e oggettivamente il potenziale e i limiti di questa tecnologia. Vengono discussi argomenti complessi riguardanti la valutazione della qualità della MT e l'efficacia dei sistemi di MT, presentando sia metodi di valutazione umana standard (ad esempio giudizi di fluidità e adeguatezza) che metriche di valutazione automatica all'avanguardia, come BLEU, BERT, ecc.

Andando oltre i presupposti teorici e metodologici, gli studenti impareranno quindi come raccogliere, elaborare e selezionare i dati per addestrare e adattare un sistema MT.

Segue un'esplorazione delle questioni correlate, come la valutazione del tempo, dello sforzo e dei costi necessari per introdurre la MT nei flussi di lavoro di traduzione, la stima e la previsione della qualità della MT, le prestazioni relative e assolute dei sistemi MT con diverse coppie linguistiche e domini linguistici.

Sulla base delle spiegazioni dei concetti teorici e delle nozioni metodologiche chiave, svolgeremo esercizi pratici e attività di riflessione riguardanti una serie di scenari in cui la MT può essere implementata. Questo aiuta gli studenti a considerare sistematicamente i suoi pro e contro, simulando gli ambienti professionali di aziende e istituzioni che utilizzano regolarmente il software MT.

Testi/Bibliografia

Durante le lezioni basate su aspetti teorici, il docente utilizzerà i seguenti riferimenti bibliografici:

Bentivogli, L., Bisazza A., Cettolo M., Federico, M. (2016) "Neural versus phrasebased machine translation quality: a a case study".
arXiv preprint arXiv:1608.04631.

Thierry Poibeau (2017), "Machine Translation", MIT Press

Joss Moorkens, S. Castilho, F. Gaspari, S. Doherty (2018) “Translation Quality Assessment: From Principles to Practice”, Springer

Bernard Scott (2018), “Translation, Brains and the Computer: A Neurolinguistic Solution to Ambiguity and Complexity in Machine Translation”, Springer

Philipp Koehn (2020), “Neural Machine Translation”, Cambridge University Press

Kyunghyun C., van Merrienboer B., Bahdanau D., Bengio Y. (2016) "On the Properties of Neural Machine Translation: Encoder-Decoder Approaches" arXiv.org > cs > arXiv:1409.1259

Toral, A., Sanchez-Cartagena V.M. (2017) "A Multifaceted Evaluation of Neural versus Phrase-Based Machine Translation for 9 Language Directions". Available online: https://arxiv.org/pdf/1701.02901.pdf

Metodi didattici

Le lezioni si svolgeranno in parte come lezioni frontali (principalmente sugli aspetti teorici e metodologici), e in parte come workshop, utilizzando un approccio partecipativo.

Gli aspetti teorici e metodologici sono presentati dal docente ed esplorati in modo più approfondito in autonomia dagli studenti attraverso letture assegnate durante il corso (data la velocità con cui il campo si evolve, la bibliografia qui inserita è da considerarsi provvisoria, da aggiornare e perfezionare durante il corso). La parte applicata consiste in esercitazioni pratiche in laboratorio, guidate dal docente con input e interazione da parte degli studenti, ed esercitazioni da svolgere autonomamente o in gruppo da parte degli studenti.

Il corso prevede l'obbligo di frequenza da parte dello studente (pari al 70%).

In considerazione della tipologia di attività e dei metodi didattici adottati, la frequenza di questa attività formativa richiede la preventiva partecipazione di tutti gli studenti ai moduli 1 e 2 di formazione sulla sicurezza nei luoghi di studio, [https://elearning-sicurezza.unibo.it/] in modalità e-learning.

Modalità di verifica e valutazione dell'apprendimento

La verifica consiste di due parti: un progetto individuale e una prova orale.

Il progetto individuale sarà assegnato allo studente durante l'ultimo mese del corso, e consiste nella creazione (adattamento) di un sistema di traduzione automatica e dell'analisi delle sue prestazioni.

Durante la prova orale, lo studente potrà discutere l'approccio utilizzato e i risultati ottenuti nel proprio progetto, nonché rispondere ad alcune domande sui contenuti del corso.

Modello di valutazione

30 – 30L risultati eccellenti, dimostrando una ottima comprensione dei contenuti del corso, così come una buona capacità di spiegare e valutare pro e contro di diversi approcci alla traduzione automatica e le sue applicazioni.

27 – 29 risultati sopra la media, con errori minori o bilanciati da una buona conoscenza dei concetti e delle applicazioni fondamentali.

24 – 26 buoni risultati, con alcuni errori o lacune di conoscenza che mostrano una parziale comprensione dei contenuti e delle competenze richieste.

21 – 23 risultati sufficienti, ma con notevoli lacune nelle conoscenze o abilità acquisite nei contenuti del corso.

18 – 20 risultati che dimostrano solo una conoscenza minima dei contenuti del corso.

< 18 insufficiente, i concetti di base non sono stati compresi o dimostrati, lo studenti dovrà ripetere il test.

Strumenti a supporto della didattica

Le lezioni si svolgono in un laboratorio informatico con connessione Internet e proiettore.
Gli studenti utilizzeranno anche software (online) di traduzione automatica, altre strumenti e risorse informatiche.

Orario di ricevimento

Consulta il sito web di Federico Garcea