B2712 - LANGUAGE, TECHNOLOGY, RESEARCH II: TEXT PROCESSING

Anno Accademico 2024/2025

  • Docente: Silvia Bernardini
  • Crediti formativi: 6
  • SSD: L-LIN/12
  • Lingua di insegnamento: Inglese
  • Modalità didattica: Convenzionale - Lezioni in presenza
  • Campus: Forli
  • Corso: Laurea in Lingue e tecnologie per la comunicazione interculturale (cod. 5979)

Conoscenze e abilità da conseguire

Lo/la studente/essa conosce gli elementi base (termini, concetti, metodi) dell’analisi dei dati linguistici. È in grado di: gestire diversi formati di dati, tra cui i formati di testo semplice e annotato; costruire e analizzare corpora di tipologie diverse tramite una varietà di strumenti di gestione e di analisi; applicare le conoscenze acquisite alla risoluzione di problemi di ricerca linguistica.

Contenuti

Il corso intende offrire una panoramica degli strumenti e dei metodi per l'analisi dei testi e dei corpora (raccolte sistematiche di testi utilizzate per scopi di ricerca linguistica). I principali temi affrontati sono:

  • Selezione ragionata dei testi (sampling); comparabilità e rappresentatività.
  • Tipologie di corpora: di specialità e di riferimento; monolingue e bilingue comparabili, paralleli.
  • Consultazione di corpora in testo semplice: metodi corpus-based e corpus-driven.
  • Annotazione morfosintattica, strutturale e contestuale; allineamento.
  • Consultazione di corpora annotati: metodi corpus-based e corpus-driven.

Testi/Bibliografia

I testi verranno indicati direttamente dalla docente nel corso delle lezioni.

Alcuni testi utili per approfondimenti:

Crawford, W. and Csomay, E. 2016. Doing corpus linguistics. Oxford and New York: Routledge.

Egbert, J., Larsson, T. and Biber, D. 2020. Doing linguistics with a corpus. Cambridge: Cambridge University Press.

McEnery, T. and A. Hardie 2012. Corpus linguistics. Method, theory and practice. Cambridge: Cambridge University Press.

Mikhailov, M. and R. Cooper 2016. Corpus linguistics for translation and contrastive studies. Oxford and New York: Routledge.

 

Metodi didattici

Il corso si svolge in modalità prettamente seminariale, con accesso diretto agli strumenti di costruzione e consultazione di corpora, nelle quali gli studenti e le studentesse applicano le conoscenze acquisite per la costruzione e utilizzo di corpora di specialità e per la consultazione di corpora liberamente disponibili nel pubblico dominio.

Le attività pratiche sono strutturate attorno a problemi autentici (problem-based) che gli studenti e le studentesse risolvono lavorando autonomamente e in gruppo. Il supporto fra pari, unito alla guida della docente, crea un ambiente didattico sereno e incentrato sull'apprendente, in grado di favorire lo sviluppo di abilità relazionali e autonomia nella risoluzione di problemi.

Modalità di verifica e valutazione dell'apprendimento

L'apprendimento viene verificato in itinere attraverso l'osservazione e l'interazione in classe e attraverso prove non valutate quali semplici task pratici e relazioni orali.

La valutazione sommativa si baserà su tre prove, due delle quali da svolgersi durante il corso (in gruppo), e una dopo la sua conclusione (individuale):

  1. Costruzione di un corpus di specialità e redazione della relativa documentazione (consegna, in gruppo) [30%]
  2. Estrazione di informazioni da corpora (presentazione in classe, in gruppo) [30%]
  3. Scheda descrittiva di un ipotetico progetto di ricerca, comprensiva di scopo/rilevanza, ipotesi/domande di ricerca, riferimenti bibliografici, corpora disponibili o testi reperibili, tipologia di informazioni da estrarre, valutazione rischi (consegna post-corso, individuale) [40%]

Chi non svolgesse tutte le parti previste nelle modalità sopra indicate sosterrà un esame finale individuale che consisterà nella consegna della prima e della terza prova e in una presentazione orale relativa alla seconda.

Strumenti a supporto della didattica

Le lezioni, di stampo seminariale, si svolgono in un laboratorio attrezzato con PC e videoproiettore per l'utilizzo di software di costruzione e analisi di corpora (Intertext editor, AntConc, NoSketch Engine) in modalità hands-on. Le presentazioni della docente vengono rese disponibili via Moodle/Virtuale. Sono altresì resi disponibili in modalità e-learning i materiali didattici prodotti all'interno del progetto UPSKILLS, in particolare relativi al corso Processing texts and corpora.

In considerazione della tipologia di attività e dei metodi didattici adottati, la frequenza di questa attività formativa richiede la preventiva partecipazione di tutti gli studenti ai moduli 1 e 2 di formazione sulla sicurezza nei luoghi di studio.

Orario di ricevimento

Consulta il sito web di Silvia Bernardini

SDGs

Istruzione di qualità Parità di genere Partnership per gli obiettivi

L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.