06450 - LINGUISTICA APPLICATA

Scheda insegnamento

  • Docente Fabio Tamburini

  • Crediti formativi 9

  • SSD L-LIN/01

  • Modalità didattica Convenzionale - Lezioni in presenza

  • Lingua di insegnamento Italiano

  • Orario delle lezioni dal 26/09/2018 al 21/12/2018

SDGs

L'insegnamento contribuisce al perseguimento degli Obiettivi di Sviluppo Sostenibile dell'Agenda 2030 dell'ONU.

Istruzione di qualità Partnership per gli obiettivi

Anno Accademico 2018/2019

Conoscenze e abilità da conseguire

Al termine del corso lo studente apprende un quadro d'insieme della linguistica applicata (principali caratteristiche e problematiche) e dei suoi rapporti con la linguistica generale. Inoltre, acquisisce le tecniche di base della linguistica dei corpora (trattamento dei testi elettronici, costruzione di corpora, ricerca basata su dati reali d’uso, tokenizzazione, lemmatizzazione, concordanze). Apprende le basi dell'analisi statistico-quantitativa del linguaggio naturale (liste di frequenza, clusters, collocazioni) e sa usare grandi corpora elettronici attraverso interfacce web dedicate.

Programma/Contenuti

LINGUISTICA APPLICATA - 6 CFU:

- I CORPORA

  • Cos'è un corpus, come si usa e che tipo di informazioni si possono ricavare.
  • Parametri per la progettazione di un corpus.
  • Rappresentatività e bilanciamento.
  • Analisi sintagmatica e paradigmatica.
  • Concordanze, collocazioni e indici di significatività.
  • Annotazioni, tipologie e formati.
- TESTI, CORPORA E LORO RAPPRESENTAZIONE DIGITALE.
  • I testi in formato elettronico, codifiche, mark-up e conversione di formati.
  • Modalità di reperimento .
  • Metodi di accesso al corpus e text retrieval.

- Case study: i corpora CORIS/CODIS, BoLC e DiaCORIS
- Web as corpus.
- Consultazione di un corpus annotato in laboratorio.

- DIDATTICA DELLE LINGUE IN AMBIENTI TECNOLOGICAMENTE AVANZATI

 

LINGUISTICA APPLICATA - 12 CFU:

Al programma da 6CFU si aggiungono i seguenti argomenti:

- PROGETTAZIONE E COSTRUZIONE DI UN CORPUS ANNOTATO IN LABORATORIO

- TRATTAMENTO AUTOMATICO DELLE LINGUE

  • Fonetica computazionale: Caratteristiche del campione audio - foni e formanti - Analisi in frequenza - Tratti soprasegmentali.
  • Morfologia computazionale: Generazione e analisi morfologica - Lemmari.
  • Sintassi computazionale: Part-of-speech tagging - Analisi sintattica della frase - Grammatiche per il linguaggio natural
  • Semantica computazionale: Semantica lessicale – WordNet.
  • Laboratorio di Linguistica Computazionale
  • Laboratorio di Machine Learning

Testi/Bibliografia

Studenti FREQUENTANTI

Capitoli tratti dai seguenti volumi, indicati esplicitamente sul sito web del corso:
- Lenci, A., Montemagni, S. and Pirrelli, V. (2005). Testo e computer, Carocci.
- McEnery T., Wilson A. (2001). Corpus Linguistics, Edinburgh University Press.
Slide, dispense e articoli scaricabili direttamente dal sito web del corso.

Studenti NON FREQUENTANTI

In aggiunta alla bibliografia indicata per gli studenti frequentanti, studiare anche:

- Cresti E., Panunzi, A. (2013). Introduzione ai corpora dell'italiano, Il Mulino.

In ogni caso, si raccomanda di  contattare il docente, in orario di ricevimento, prima di iniziare lo studio in modo da ricevere tutte le spiegazioni riguardanti i materiali da studiare per l'esame ed evitare così ogni fraintendimento o problema.

Metodi didattici

Il corso di svolge in aula e comprende circa 60 ore di lezioni frontali (12CFU) o 30 ore di lezione (6CFU). All'interno delle 60 ore del corso da 12 CFU è prevista un'attività da svolgersi in laboratorio sotto la supervisione del docente.

Modalità di verifica dell'apprendimento

L'esame consiste in un colloquio orale sul programma d'esame atto a valutare le capacità critiche e le conoscenze metodologiche maturate dallo studente.
Il raggiungimento da parte dello studente di una visione organica dei temi affrontati a lezione, la dimostrazione del possesso di una padronanza espressiva e di linguaggio specifico saranno valutati con voti di eccellenza. La conoscenza per lo più meccanica e/o mnemonica della materia, capacità di sintesi e di analisi non articolate e/o un linguaggio corretto ma non sempre appropriato porteranno a valutazioni discrete; lacune formative e/o linguaggio inappropriato – seppur in un contesto di conoscenze minimali del materiale d'esame - condurranno a voti che non supereranno la sufficienza. Lacune formative, linguaggio inappropriato, mancanza di orientamento all'interno degli argomenti discussi durante il corso non potranno che essere valutati negativamente.

E' SEMPRE obbligatorio iscriversi all'esame utilizzando la procedura online.

Strumenti a supporto della didattica

Il sito web del corso è stato progettato per essere il fulcro degli strumenti didattici. Contiene la maggior parte dei materiali didattici in formato elettronico, un'indicazione di tutte le procedure e le modalità di erogazione del corso, nonché una ricca raccolta di software del settore.

E' stato inoltre predisposto un CD-ROM/USB a disposizione degli studenti contenente un ambiente di lavoro completo per sperimentare le metodologie proposte nel corso. Questo strumento verrà utilizzato anche nelle esercitazioni in laboratorio.

Link ad altre eventuali informazioni

http://corpora.ficlit.unibo.it/LingAppl/

Orario di ricevimento

Consulta il sito web di Fabio Tamburini