82022 - MACHINE TRANSLATION AND POST-EDITING (CL1)

Anno Accademico 2020/2021

  • Docente: Claudia Lecci
  • Crediti formativi: 5
  • Lingua di insegnamento: Inglese
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Forli
  • Corso: Laurea Magistrale in Specialized translation (cod. 9174)

Conoscenze e abilità da conseguire

Lo/a studente/ssa - conosce i principi teorici della traduzione automatica ed è capace di utilizzare con autonomia le principali risorse informatiche e telematiche in questo ambito; ha le competenze specialistiche strumentali al postediting (revisione) di testi relativi a diversi ambiti settoriali tradotti in modo automatico - è in grado di concepire, gestire e valutare progetti articolati di traduzione automatica e post-editing in cui intervengono diverse competenze operative distribuite su più persone, nel rispetto della deontologia professionale - è in grado di elaborare autonomamente ulteriori conoscenze e competenze di livello superiore negli àmbiti della traduzione automatica e del post-editing e di utilizzarle in diversi campi

Contenuti

Il modulo di "Machine Translation and Post-editing" (MatPed) si svolge al secondo semestre ed è uno dei tre che compongono il corso di "Technology for Translation", insieme a "Terminology and Information Mining" (TerMine), tenuto nel primo semestre dal Prof. Adriano Ferraresi, e a "Computer-Assisted Translation and Web Localization" (CatLoc), tenuto nel secondo semestre dalla sottoscritta.

Il modulo MatPed si svolge al secondo semestre e si compone a sua volta di due parti, una di traduzione automatica (TA) e una di post-editing (PE), legate e interdipendenti tra loro.

Nella prima parte, strettamente connessa alla seconda, vengono illustrate le basi teoriche della TA, partendo da una breve panoramica delle tappe fondamentali della sua storia, dagli anni '40 fino agli sviluppi più recenti, successivamente vengono presentate le principali architetture dei sistemi di TA. Anche grazie a un approfondimento di diversi fenomeni linguistici e traduttivi particolarmente ostici per i sistemi di TA, gli studenti vengono sensibilizzati a valutare in modo critico e consapevole le potenzialità e i limiti di questi strumenti. Vengono analizzate le complesse tematiche legate alla valutazione della qualità dei sistemi di TA e della loro efficacia, discutendo sia le metodologie standard manuali (giudizi su adeguatezza, scorrevolezza, ecc.), sia le metriche di valutazione automatica attualmente più diffuse (BLEU, TER, ecc.). Segue l'esplorazione di argomenti affini, tra i quali la valutazione dei costi e tempi dell'introduzione della TA nei flussi di lavoro, la stima preliminare e la previsione della qualità della traduzione automatica. Sulla base delle spiegazioni dei concetti teorici e delle principali nozioni rilevanti, questi argomenti sono affrontati tramite esercitazioni pratiche e riflessioni critiche relative a vari scenari di impiego della TA, per valutarne in modo sistematico pro e contro, simulando i contesti professionali di realtà aziendali e istituzionali che adottano regolarmente software di TA.

La seconda parte, saldamente collegata alla prima, si concentra in particolare sul PE di testi tradotti con sistemi di TA, confrontando questa operazione con altre opzioni esistenti per rendere efficaci e fruibili i testi tradotti automaticamente. Tra queste figurano il pre-editing, il linguaggio controllato per la stesura di input ristretto e l'approccio basato sulla ‘sublanguage' per determinati domini di specialità, in particolare quando un unico testo di partenza validato va tradotto automaticamente in varie lingue. In merito al PE vengono approfondite diverse modalità di intervento (minimo, completo, ecc.) in relazione a variabili quali le condizioni specifiche del particolare incarico di revisione, il profilo del post-editor (bilingue, monolingue della lingua d'arrivo, esperto del settore, ecc.), la tipologia della traduzione, la sede di pubblicazione e le modalità di diffusione previste per il testo d'arrivo revisionato, i suoi potenziali lettori e utenti, ecc. Vengono presentate le varie strategie di PE che permettono di migliorare l'output grezzo ottenuto dai sistemi di TA e di elaborare quindi un testo d'arrivo finale di qualità adeguata alle specifiche esigenze del contesto traduttivo, intervenendo a seconda dei casi con il numero minimo di cambiamenti possibile o cercando di raggiungere una qualità alta/pubblicabile per il testo finale. Le tematiche relative alla qualità e all'efficacia del post-editing vengono inquadrate in base al risparmio di tempo che esso consente, a seconda dello standard linguistico richiesto per un particolare testo d'arrivo, che sia funzionale alla sua fruizione prevista. Infine, vengono esplorati alcuni collegamenti relativi all'utilizzo della TA, accompagnato dal post-editing, nel lavoro dei traduttori professionisti che impiegano gli strumenti di traduzione assistita dal computer, in particolare le memorie di traduzione.

In entrambe le parti si metteranno a frutto e si utilizzeranno i metodi e le risorse presentati durante il modulo TermMine.

Testi/Bibliografia

Durante le lezioni di carattere più teorico, la docente farà riferimento alla seguente bibliografia:

Arnold, D.J., L. Balkan, S. Meijer, R. Lee Humphreys & L. Sadler (1994) "Machine Translation: An Introductory Guide". London: Blackwells-NCC. Disponibile online: www.essex.ac.uk/linguistics/external/clmt/MTbook

Bentivogli, L., Bisazza A., Cettolo M., Federico, M. (2016) "Neural versus phrasebased machine translation quality: a a case study".
arXiv preprint arXiv:1608.04631

Bersani Berselli, G. (a cura di) (2011) "Usare la Traduzione Automatica". Bologna: CLUEB.

Carl, J., Gutermuth, S & Hansen Schirra, S (2015) "Post-Editing Machine Translation. Efficinecy, strategies and revision processes in professional translation settings". In Psycholinguistic and Cognitive Inquiries into Translation and Interpreting. Amsterdam and Philadelphia: John Benjamins.

Hutchins, J. (1986) "Machine Translation: Past, Present, Future". Chichester: Ellis Horwood. Disponibile online: www.hutchinsweb.me.uk/PPF-TOC.htm

Hutchins, W.J. & H.L. Somers (1992) "An Introduction to Machine Translation". London: Academic Press. Disponibile online: www.hutchinsweb.me.uk/IntroMT-TOC.htm

Hutchins, W.J. & H.L. Somers (1995) "Introduccion a la Traduccion Automatica". Madrid: Visor [traduzione spagnola di Hutchins & Somers (1992)]

Koponen, M. (2016) "Is machine translation post-editing worth the effort? A survey of research into post-editing and effort". The Journal of Specialised Translation. Disponibile online: https://www.jostrans.org/issue25/art_koponen.pdf

Kyunghyun C., van Merrienboer B., Bahdanau D., Bengio Y. (2016) "On the Properties of Neural Machine Translation: Encoder-Decoder Approaches" arXiv.org > cs > arXiv:1409.1259

Loffler-Laurian, Anne Marie (1996) "La Traduction Automatique". Vileneuve d'Ascq: Presses Universitaires du Septentrion.

Quah, C.K. (2006) "Translation and Technology". Basingstoke: Palgrave MacMillan.

Somers, Harold (ed.) (2003) "Computers and Translation: A Translator's Guide". Amsterdam and Philadelphia: John Benjamins.

Guerberof, Ana (2009) "Productivity and Quality in the Post–editing of Outputs from Translation Memories and Machine Translation”. Localisation Focus 7(1): 11-21. Disponibile online: http://isg.urv.es/library/papers/2009_Ana_Guerberof_Vol_7-11.pdf

NIST (2007) Post Editing Guidelines for GALE Machine Translation Evaluation. Disponibile online: http://projects.ldc.upenn.edu/gale/Translation/Editors/GALEpostedit_guidelines-3.0.2.pdf

O'Brien, Sharon (2002) “Teaching Post-editing: A Proposal for Course Content”. Proceedings of the 6th EAMT Workshop on “Teaching Machine Translation”. EAMT/BCS, UMIST, Manchester, UK. 99-106. Disponibile online: http://mt-archive.info/EAMT-2002-OBrien.pdf

Poulis, Alexandros and David Kolovratnik (2012) "To Post-edit or not to Post-edit? Estimating the Benefits of MT Post-editing for a European Organization". Proceedings of the AMTA 2012 Workshop on Post-editing Technology and Practice (WPTP 2012). The Tenth Biennial Conference of the Association for Machine Translation in the Americas, October 28-November 1 2012, San Diego, CA, USA. Disponibile online: http://amta2012.amtaweb.org/AMTA2012Files/html/9/9_paper.pdf

Toral, A., Sanchez-Cartagena V.M. (2017) "A Multifaceted Evaluation of Neural versus Phrase-Based Machine Translation for 9 Language Directions". Disponibile online: https://arxiv.org/pdf/1701.02901.pdf

Metodi didattici

Oltre a prevedere spiegazioni teoriche, le lezioni in presenza sono svolte in modo partecipativo, sotto forma di workshop.

Gli aspetti teorici vengono presentati dal docente in classe e approfonditi in modo autonomo dagli studenti attraverso letture ed esercitazioni assegnate durante il corso. La componente pratica consiste in esercitazioni svolte in laboratorio sotto la guida del docente e in esercizi di consolidamento e approfondimento da svolgere in gruppo o autonomamente a casa.

Il corso prevede l'obbligo di frequenza da parte dello studente (pari al 70%).

Modalità di verifica e valutazione dell'apprendimento

La verifica dell'apprendimento consiste in una prova scritta della durata di due ore contenente due quesiti, uno teorico e uno pratico, riguardanti i principi teorici affrontati in classe durante il modulo e le loro applicazioni nella traduzione professionale, con un'analisi critica delle relative modalità di svolgimento e potenzialità.

 

Il quesito pratico vale 20 punti e sarà valutato secondo i seguenti criteri: errori gravi (l'assenza di uno o più dei requisiti essenziali richiesti nelle istruzioni fornite) comporteranno la sottrazione di 2 punti per ciascun requisito mancante; errori non gravi (l'impostazione errata di una o più procedure) comporteranno la sottrazione di un punto per ogni procedura errata; errori di distrazione (l'assenza di uno o più dei requisiti formali indicati nelle istruzioni) comporteranno la sottrazione di 0,5 punti per ogni requisito mancante.

 

Il quesito teorico vale 10 punti e sarà valutato secondo i seguenti criteri: pertinenza della risposta rispetto alla domanda,  completezza e chiarezza delle informazioni presentate, capacità di esposizione critica dei concetti chiave.

 

Il voto finale del corso di "Technology for Translation" sarà rappresentato dalla media aritmetica dei voti ottenuti nei moduli TerMine, CatLoc e MatPed.

 

Gli esiti vengono comunicati qualche giorno dopo tramite la piattaforma Moodle.

Strumenti a supporto della didattica

Le lezioni si svolgono in laboratorio informatico con collegamento Internet, videoproiettore e l'utilizzo di vari software, strumenti e risorse (anche online) di traduzione.

I materiali didattici sono resi disponibili tramite la piattaforma Moodle.

Link ad altre eventuali informazioni

https://moodle.sslmit.unibo.it/course/view.php?id=1385

Orario di ricevimento

Consulta il sito web di Claudia Lecci