Foto del docente

Paolo Scampa

Assistant professor

Department of Interpreting and Translation

Academic discipline: L-LIN/04 Language and Translation – French

Useful contents

Applicatif interactif de recherche, d'enseignement et d'apprentissage du vocabulaire fondamental du français.

L'applicatif sur excel est disponible sur demande.

 

Le corpus lexical comprend les 2204 bases lexicales les plus fréquentes du vocabulaires français qui en contient au total 10645. Ces bases morpho-lexicales engendrent par dérivation 27006 mots à savoir plus de la moitié des environ 53000 mots simples contenus dans le corpus FROG. Le corpus est interactif et contemple plusieurs critères de sélection du matériel. (Fréquence d'usage écrite, catégorie grammaticale, étymologie, présence d'un verbe au sein de la famille ou non, si le mot est membre d'une famille ou s'il s'agit d'un sans famille, si le signifiant est ou non isomorphe avec l'italien.)

Les fréquences d'usage tirées du corpus Frog relèvent d'un dépouillement de 36,7 millions d'occurrences écrites de presque 60000 mots dont plus de 7200 sont des mots composés. Ici le terme de "base" réunit sous une seule dénomination les "racines", identifiables parce qu'il y a un paradigme morpholexical attesté, que les mots orphelins sans paradigme lexical. L'indice "Fm" vaut pour "famille" et "SFm" pour "sans famille" (qui par définition n'est jamais un verbe) et permet des analyses séparées. Les indices Vb.( verbe) et Sv.(sans verbe) ouvent à une étude objectivée des motifs, entre autre d'ordre conceptuel; qui font que certains signes ne développent pas de prédicat verbal. Les bases familles présentes sont le membre de plus haute fréquence de leur famille.