Foto del docente

Malvina Nissim

Ricercatrice confermata

Dipartimento di Filologia Classica e Italianistica

Settore scientifico disciplinare: L-LIN/01 GLOTTOLOGIA E LINGUISTICA

Curriculum vitae

Malvina Nissim è ricercatrice in linguistica presso il Dipartimento di Studi Linguistici e Orientali. Si laurea cum laude nel 1998 in Lettere Classiche, indirizzo linguistico, presso l'Università degli Studi di Pisa, approfondendo aspetti linguistici e cognitivi delle espressioni di possesso. Nel 2002 consegue il Dottorato in Linguistica presso l'Università di Pavia con una tesi in linguistica computazionale relativa alla scelta dei determinatori in espressioni anaforiche (principalmente nella lingua inglese). Durante gli studi di dottorato è stata ospite del Dipartimento di Linguistica dell'Universität Konstanz, in Germania, e del Institute for Communicating and Collaborative Systems, School of Informatics, University of Edinburgh, nel Regno Unito. Presso quest'ultimo istituto è poi rimasta per un post-doc fino all'inizio del 2006. Dopo qualche mese di collaborazione con il Laboratorio di Ontologia Applicata dell'Istituto di Scienze e Tecnologie della Cognizione del CNR, a Roma, nell'ottobre 2006 vince un posto da ricercatore presso l'Università di Bologna, ed ottiene la conferma in ruolo nel 2011 (posticipata per congedi di maternità).

Si occupa principalmente di linguistica computazionale e dell'utilizzo di corpora per l'analisi linguistica.

______________________________________________________________________________    
Titoli e Formazione

______________________________________________________________________________ 

01/2002 Dottorato in Linguistica. Tesi: Bridging Definites and Possessives: Distribution of Determiners in Anaphoric Noun Phrases. Relatori: Prof.Michele Prandi, Prof. Giacomo Ferrari e Prof. Anna Giacalone Ramat. Commissione: Prof. Marcella Bertuccelli Papi, Prof. Michela Cennamo e Prof. Paolo Di Giovine.

1998—2001 Corso di Dottorato in Linguistica, XIV ciclo, Dipartimento di Linguistica, Università di Pavia. Borsa ministeriale.

1993—1998 Laurea in Lettere Classiche, indirizzo linguistico, Dipartimento di Linguistica, Università di Pisa. Tesi: Spazi Mentali, Meronimia e Definitezza: Semantica delle Costruzioni Possessive. Relatori: Prof. Romano Lazzeroni e Prof. Giacomo Ferrari. Voto: 110/110 e lode.

1988—1993 Liceo Ginnasio “G. Galilei”, Pisa. Maturità classica: 60/60

____________________________________________________________________________
Esperienze Lavorative
____________________________________________________________________________

11/2006-oggi Ricercatore universitario (L-LIN/01), Dipartimento di Studi Linguistici e Orientali,
Università di Bologna.

03/2006-10/2006 “Collaboratore a progetto, Laboratory for Applied Ontology,
Istituto di Scienze e Tecnologie della Cognizione, CNR, Roma. Progetto:
∙ NeOn – Lifecycle Support for Networked Ontologies (Comunità Europea, Framework VI)

01/2002–01/2006 “Research fellow” (RA1A), Institute for Communicating and Collaborative Systems,
School of Informatics, Università di Edimburgo. Progetti:
∙ TXM (Text Mining for Biomedicine)
Finanziato da ITI Lifesciences, Scozia. Collaborazione Università di Edimburgo e COGNIA EU.
Propositori, assegnatari e responsabili: Dr. C. Grover, Prof. E. Klein, Dr. R. Tobin.


∙ Machine Learning of Entity Recognizers for Modular Retargetable NLP .
Finanziato dalla Scottish Enterprise all'interno del programma di collaborazione
“Edinburgh-Stanford Link”. Propositori, assegnatari e responsabili:
Dr. C. Grover (Edimburgo), Prof. E. Klein (Edimburgo), Prof. C. Manning (Stanford),
Dr. K. Markert (Edimburgo/Leeds), Dr. M. Nissim (Edimburgo)


∙ Paraphrase Analysis for Improved Generation.
Finanziato dalla Scottish Enterprise all'interno del programma di collaborazione
“Edinburgh-Stanford Link”. Propositori, assegnatari e responsabili:
Prof. J. Bresnan (Stanford), Dr. J. Carletta (Edimburgo), Dr. D. Crouch (Stanford),
Dr. M. Nissim (Edimburgo), Prof. M. Steedman (Edimburgo), Prof. T. Wasow (Stanford),
Dr. A. Zaenen (Stanford)

2001–2002 “Research associate” (RA1B), Institute for Communicating and Collaborative Systems,
School of Informatics, Università di Edimburgo.
Progetto: Metonymy Annotation Schemes and Robust Analysis.
Finanziato dallo Economic and Social Research Council (ESRC), Regno Unito.
Propositore, Assegnatario e Responsabile: Dr. Katja Markert.

2000 Traduttore a contratto Inglese→Italiano per la casa editrice Bruno Mondadori.

_________________________________________________________________________________________
Didattica
_________________________________________________________________________________________

  • 2011/2012: Rappresentazione dell'Informazione Semantica, Corso di Laurea Magistrale in Scienze Linguistiche, Università di Bologna.
  • 2010/2011: Rappresentazione dell'Informazione Semantica, Corso di Laurea Magistrale in Scienze Linguistiche, Università di Bologna.
  • 2009/2010: Rappresentazione dell'Informazione Semantica, Corso di Laurea Magistrale in Scienze Linguistiche, Università di Bologna.
  • 2009/2010: Fondamenti di Linguistica (con Nicola Grandi), Corso di Laurea Magistrale in Scienze Linguistiche, Università di Bologna.
  • 2008/2009: Linguistica dei Corpora (2), Corso di Laurea Specialistica in Linguistica, Università di Bologna.
  • 2008/2009: Rappresentazione dell'Informazione Semantica, Corso di Laurea Magistrale in Italianistica, Culture Letterarie Europee e Scienze Linguistiche, Università di Bologna.
  • 2008/2009: Fondamenti di Linguistica (modulo di “Semantica e Lessico”), Corso di Laurea Magistrale in Italianistica, Culture Letterarie Europee e Scienze Linguistiche, Università di Bologna.
  • 2007/2008: Storia del Pensiero Linguistico, Corso di Laurea Specialistica in Linguistica, Università di Bologna.
  • 2007/2008: Semantica e Lessico (1), Corso di Laurea Specialistica in Linguistica, Università di Bologna.
  • 2006/2007: Linguistica dei Corpora (2), Corso di Laurea Specialistica in Linguistica, Università di Bologna.
  • 2002: Techniques in Natural Language Processing 2. Insegnante, Tutor, e responsabile esercitazioni. MSc in Informatics (Natural Language and Language Engineering), Università di Edimburgo. Titolare del corso: Prof Bonnie Webber.
  • 2001: Tecniche per la Costruzione e l'Analisi di Corpora, Corso intensivo (16 ore) per dottorandi tenuto all'Università di Pavia, all'interno del Programma di Dottorato in Linguistica. Titolare, insegnante, esercitatrice.
  • 1998: Corsi di Italiano per Stranieri. Insegnante di Italiano e responsabile del Laboratorio Linguistico presso i Corsi di Italiano per Stranieri, Dipartimento di Linguistica, Università di Pisa.

_______________________________________________________________
Soggiorni di Formazione all'Estero
_______________________________________________________________

12/2010–03/2011 Centre for Language and Cognition Groningen (CLCG),
Rijksuniversiteit Groningen. Contatto: Prof. Gisela Redeker

09/2000—03/2001 Institute for Communicating and Collaborative Systems,
School of Informatics, Università di Edimburgo. Contatto: Prof. Bonnie Webber

10/1999—03/2000 Fachbereich Sprachwissenschaft (Dipartimento di Linguistica),
Università di Costanza. Contatto: Prof. Klaus von Heusinger

_______________________________________________________________________________
Interessi di Ricerca
_______________________________________________________________________________

Durante gli anni di dottorato e post-dottorato, ho sviluppato abilità e interessi di ricerca in vari ambiti dell'elaborazione del linguaggio naturale (Natural Language Processing), combinando una solida preparazione linguistica con acquisite tecniche computazionali, e così creando un ponte di ricerca tra la linguistica e l'informatica. Usando approcci sia statistici che simbolici, ho lavorato in particolare nei seguenti campi:

  • Risoluzione dell'Anafora: lavori teorici e corpus-based su fenomeni di bridging (anafore indirette), other-anafora, e coreferenza. Confronto teorico e corpus-based di sintagmi nominali definiti a testa piena e costruzioni genitivali. Sviluppo di metodi simbolici e statistici per la risoluzione di anafore lessicali a testa piena. Uso innovativo del Web in sostituzione di basi di conoscenza organizzate per la risoluzione di anafore a testa piena. Annotazione di coreferenza pronominale e pronomi relativi in dialoghi spontanei (inclusi linee guida per l'annotazione e coordinamento del progetto di annotazione).
  • Struttura del Discorso: sviluppo del primo schema di annotazione dettagliato per l'annotazione della struttura dell'informazione in Inglese. Coordinamento del progetto di annotazione. Analisi di costruzioni sintattiche alternative (attivo/passivo, genitivo prenominale/genitivo postnominale, alternanza dativa, ...) sfruttando tale annotazione. In corso: (i) apprendimento automatico della struttura dell'informazione; (ii) generazione automatica della corretta forma genitiva nel contesto.
  • Risoluzione di Ambiguità Semantiche: primo modello statistico per la risoluzione automatica di metonimie. Particolare attenzione a nomi di luoghi e aziende. Integrazione di un thesaurus per risolvere problemi di scarsezza di dati e per class-based smoothing. Analisi approfondita di fenomeni di metonimia nel discorso e interazione con metafore.
  • Estrazione dell'Informazione: metodi statistici per il riconoscimento e la risoluzione di “named entities” in diversi domini (news, biomedicina, astronomia, arte, geografia). Miglior sistema in assoluto per il riconoscimento di “named entities” in campo biomedico (2004). Annotazione di corpora; responsabile principale e coordinatrice dell'annotazione di testi biomedici per il progetto “TXM” (“named entities”, disambiguazione, e relazioni tra named entities). Metodi statistici per l'estrazione di relazioni tra elementi del discorso.
  • Analisi morfologica e semantica, corpus-based, di nominali complessi in italiano, inclusa la caratterizzazione di espressioni polirematiche.
  • Web semantico

________________________________________________________________
Fondi di Ricerca e Borse di Studio
________________________________________________________________

  • Fondi di Ricerca 
  • 2002 Progetto biennale finanziato dalla Scottish Enterprise all'interno del programma “Edinburgh-Stanford Link (co-Proponente/Assegnatario/Responsabile): Machine Learning of Entity Recognizers for Modular Retargetable NLP (169,448 GBP)
  • 2002 Progetto biennale finanziato dalla Scottish Enterprise all'interno del programma “Edinburgh-Stanford Link (co-Proponente/Assegnatario/Responsabile): Paraphrase Analysis for Improved Generation (73,626 GBP)

  • Borse di Studio
  • 2010 Beneficiaria di una borsa Marco Polo, tre mesi, Centre for Language and Cognition Groningen, Rijksuniversiteit Groningen
  • 2004 Borsa per giovani ricercatori erogata dalla European Science Foundation per partecipare alla conferenza “Mind, Metaphor and Language Conference, Granada, Spagna.
  • 2002 Borsa per giovani ricercatori erogata dalla European Science Foundation per partecipare alla conferenza “Mind, Metaphor and Language, Kerkrade, Olanda.
  • 2000 Borsa “Giovani Ricercatori, Università di Pavia (ca. 8,500 Euro, in collaborazione con A. Sansò). Progetto: Semantica Lessicale e Semantica del Discorso: Verso un Modello Computazionale.

    1999 Borsa dell'Università di Costanza, Germania, per un soggiorno di tre mesi presso il Dipartimento di Linguistica (vincitrice di una delle tre borse disponibili per dottorandi presso l'Università di Pavia)

    1996 Borsa dell'Università di Heidelberg, Germania per un corso mensile di Lingua Tedesca (vincitrice di una delle tre borse disponibili per laureandi presso l'Università di Pisa)

    1995 Borsa dell'Università di Salamanca per un corso mensile di Lingua Spagnola (unica vincitrice della borsa disponibile per laureandi presso l'Università di Pisa)


__________________________________________________________________________________________________
Seminari Invitati
_________________________________________________________________________________

  • Universität Stuttgart, seminario invitato, Workshop on Partitivity, Aprile 2010.
  • Workshop On Definiteness, Università di Oslo, keynote speaker. Definite Genitives: Predicting the Alternation. Novembre 2010.
  • Università di Pavia, seminari di Dottorato. Corpora e Natural Language Processing: Principi di Apprendimento Automatico, Dicembre 2009.
  • Lab MoDyCo (Modèles, Dynamiques, Corpus), Université Paris Ouest Nanterre - La Défense, Paris. Data and Models for Discourse Processing, Dicembre 2008.
  • Scuola Normale Superiore, Classe di Lettere, Pisa. Data and Models for Automatic Metonymy Resolution and Understanding, Ottobre 2006.
  • Scuola Superiore di Lingue Moderne per Interpreti e Traduttori, Università di Bologna. Risolvere sul Web Sintagmi Nominali Anaforici, Aprile 2006.
  • Università di Roma “Tor Vergata, Ingegneria Informatica, Artificial Intelligence Research Group. Sorgenti di Informazione Lessicale per la Risoluzione di Sintagmi Nominali Anaforici, Maggio 2005.
  • Università di Edimburgo, ICCS, BioNLP group. Mining External Resources for BioMedical IE, Marzo 2005.
  • Istituto di Linguistica Computazionale (ILC-CNR), Pisa. Syntactic Features and Word Similarity for Supervised Metonymy Resolution, Settembre 2003.

_________________________________________________________________________
Organizzazione di Eventi
_________________________________________________________________________

  • “Metonymy Resolution at SemEval-2007. Shared Task on Metonymy Resolution within the International Evaluation Campaign SemEval 2007 (http://nlp.cs.swarthmore.edu/semeval/).
  • “Senso Comune Workshop”, Palazzo Barberini, Roma, in collaborazione con Fondazione IBM, Novembre 2006.
  • 7th ESSLLI Student Session, Organizzatrice e Chair. Tenuta all'interno della 14esima European Summer School in Logic Language and Computation (ESSLLI 2002), Agosto 2002, Trento, Italia.
  • 6th ESSLLI Student Session, Co-chair per l'area “Language. Tenuta all'interno della 13esima European Summer School in Logic Language and Computation (ESSLLI 2001), Agosto 2001, Helsinki, Finlandia.
  • First Pavia Postgraduate Conference in Linguistics (Papocol 2000). Ideatrice e membro del comitato organizzativo e scientifico, Pavia, 24-25 Novembre 2000.
  • Workshop on Procedures in Discourse Interpretation. Ideatrice e membro del comitato organizzativo e scientifico. Tenuto all'interno della 4a EUROLAN Summer School on Human Language Technology (EUROLAN'99), Luglio 1999, Iasi, Romania.

______________________________________________________________________
Responsabilità Accademiche
______________________________________________________________________

(Co-)Supervisione di tesi di laurea specialistica:

  • Andrea Zaninello, Towards a characterisation of Italian Multiword Expressions through corpus-based studies, Laurea Specialistica in Linguistica (relatore)
  • Arianna Bravi, Semantica del possesso in Latino: studio sui dati, Laurea Specialistica in Linguistica (relatore)
  • Veronica Boschi, Un occhio alla teoria con dati alla mano: Parti del corpo e modelli di traslazione del significato, Laurea Magistrale in italianistica, culture letterarie europee e scienze linguistiche (relatore)
  • Jonathan Sanfilippo, Argument selection or argument coercion? Aspetti teorici e risorse linguistiche nell'interpretazione dell'argomento verbale, Laurea Magistrale in italianistica, culture letterarie europee e scienze linguistiche (relatore)
  • Andrea Beltrama, Il suffisso “-issimo” in italiano: aspetti semantici e pragmatici, Laurea Specialistica in Linguistica (correlatore)
  • Clara Cotroneo, Laurea Magistrale in italianistica, culture letterarie europee e scienze linguistiche (correlatore)
  • Alessandra Ferrera, Fenomeni anaforici in Italiano: aspetti linguistici e computazionali, Laurea Specialistica in Linguistica (correlatore)
  • Sara Perboni, Il sintagma aggettivale nelle risorse informatiche per l'italiano, Laurea Specialistica in Linguistica (correlatore)
  • Daniele Virgillito, Bracketing Paradoxes in Italian, Laurea Specialistica in Linguistica (correlatore)

Co-supervisione di tesi di laurea triennale:
  • Michele Zaccaria, Linguistica Computazionale, 2007/2008
Commissione per la valutazione di tesi di dottorato per ammissione alla consegna (ICCS, School of Informatics, Università di Edimburgo):
  • Colin Bannard, Modelling the Multiword Lexicon with Corpora, 2005.
  • Natalia N. Modjeska Resolving Other-Anaphora, 2002.
'Referaggio' per riviste internazionali:
  • Computational Linguistics
  • Journal of Logic, Language, and Information
  • Discourse Processes
  • IEEE Intelligent Systems
  • Linguistic Issues in Language Technology
  • Journal of Language Resources and Evaluation
  • Journal of Computer Speech and Language
  • International Journal of Geographical Information Systems
  • International Journal of Human-Computer Studies
'Referaggio' per conferenze/workshop internazionali:
  • ESSLLI 2001 student session (comitato scientifico)
  • ESSLLI 2003 student session
  • Eurolan 2003 Workshop on Information Extraction and Ontologies 2003 (comitato scientifico)
  • ACL 2004 Workshop on Semantic Annotation (comitato scientifico)
  • ESSLLI 2005 student session
  • KI 2005 (28th German Conference on Artificial Intelligence)
  • ACL 2006
  • EMNLP 2006
  • ESWC 2007
  • ACL 2007
  • ACL Student Workshop 2007
  • ESSLLI 2007 Student Session
  • EMNLP 2007
  • STEP 2008
  • ACL 2008
  • LREC 2008
Commissione per la selezione del personale per le seguenti posizioni (ICCS, School of Informatics, Università di Edimburgo):
  • Ricercatore a tempo determinato con specialità in apprendimento automatico (Progetto Machine Learning of Entity Recognizers for Modular Retargetable NLP )
  • Ricercatore a tempo determinato con specialità in “document retrieval” (Progetto TXM)
  • Ricercatore a tempo determinato con specialità in metodi statistici per estrazione dell'informazione (Progetto TXM);
  • Ricercatore a tempo determinato con specialità in metodi ibridi in semantica computazionale (Progetto TXM);
Incarichi:
  • Vice-presidente e socio fondatore dell'associazione Senso Comune (Presidente: Tullio De Mauro)
  • Membro della Standing Committee per la European Summer School in Logic, Language, and Information (dal 2008)
  • Responsabile gruppo di lavoro “Information Extraction” (organizzazione seminari, mantenimento web-page, liste bibliografiche), ICCS, School of Informatics, Università di Edimburgo, 2002-2003

__________________________________________________________________________________________________

Abilità Informatiche
_____________________________________________________________________________

  • Piattaforme: Unix, Linux, MacOS (classic e X), Windows
  • Processori di Testo: LaTeX, HTML, XML, XSLT, Microsoft Word
  • Linguaggi: Shell scripting, Perl, Prolog