Foto del docente

Fabio Tamburini

Professore associato confermato

Dipartimento di Filologia Classica e Italianistica

Settore scientifico disciplinare: L-LIN/01 GLOTTOLOGIA E LINGUISTICA

Temi di ricerca

Parole chiave: Linguistica Computazionale Prominenza frasale Analisi sintattica Corpora Deep Learning Annotazione di corpora

ASPETTI PROSODICI DELLA LINGUA PARLATA
Identificazione automatica della prominenza frasale nella lingua parlata, anche in una prospettiva interlinguistica e tipologica. Individuazione della struttura informativa degli enunciati sia tramite metodologie fonetico/acustiche sul parlato sia utilizzando metodologie proprie dell'analisi testuale computazionale sulla trascrizione.

ANALISI DEL LINGUAGGIO PATOLOGICO
Nell'ultimo anno si è occupato dell'identificazione precoce della malattia di Alzheimer mediante l'analisi computazionale della produzione spontanea dei pazienti.

MODELLI SEMANTICI DISTRIBUZIONALI
Costruzione di modelli geometrici per la gestione computazionale del significato – Word Space, Semantic Vector Space o Word/Document embedding – a livello lessicale, applicandoli all'inglese e all'italiano al fine di costruire un sistema automatico per l'induzione automatica dei sensi delle parole – Word Sense Induction and Discrimination.

ANNOTAZIONE MORFOLOGICA DI GRANDI CORPORA E STRUMENTI AUTOMATICI PER L'ANALISI MORFOLOGICA
Annotazione morfologica del corpus CORIS/CODIS ovvero l'inserimento automatico di opportune annotazioni in grado di consentire ricerche mirate su singoli morfemi e/o su combinazioni di essi.

ANALISI SINTATTICA DELLA LINGUA CON STRUMENTI AUTOMATICI
Creazione, anche mediante procedure automatiche di learning, di una grammatica categoriale (Categorial Type Logic Grammar) per l'italiano; studio e realizzazione di strumenti automatici per l'analisi sintattica della lingua (parsing) nell'ambito dei modelli categoriali. Sviluppo di nuovi modelli formali per la gestione automatizzata dei fenomeni linguistici (Unification Categorial Grammar)

STRUMENTI PER L'ANNOTAZIONE DI GRANDI CORPORA
Induzione automatica di un insieme di categorie lessicali per la lingua italiana, con le quali poter annotare i corpora rispetto alle parti del discorso; studio e implementazione di annotatori automatici per parti del discorso.

LINGUISTICA DEI CORPORA
Progettazione, costruzione e annotazione di grandi corpora.

METODOLOGIE DI MACHINE LEARNING E DEEP LEARNING
Negli ultimi anni ha anche avviato lo studio e l'applicazione delle tecniche di Deep Learning ai problemi classici della Linguistica Computazionale. In particolare sta sviluppando algoritmi innovativi basati sul calcolo quantistico della probabilità.