Lo sviluppo di un nostro corpus ragionato del francese nel quale le
parole sono raggruppate in famiglie lessicali a due scopi
principali. Nella sua veste di ricerca fondamentale prospetta ad
una analisi statistica dell'intero lessico e alla disamina
obiettiva delle varie dinamiche sincroniche e diacroniche del
lessico nonché dei rapporti i parlanti intrattengono con esso.
Nella sua seconda veste di ricerca applicata si prospetta come
strumento di consultazione per la comunità scientifica e come
strumento per la didattica, contrastiva e non, della lingua e della
traduzione.
Intrapreso anni fa, questo percorso lessicografico porta al
paziente inventario delle « radici sincroniche del francese » e la
conseguente, laboriosa, costituzione di un corpus ragionato esteso
dell'intero vocabolario d'uso del francese. In evoluzione continua,
questo corpus di 53.000 entrate è all'ora attuale suddiviso in
circa 10.600 raggruppamenti morfologici. Si vuole innanzi tutto
un'opera di riordinamento ragionato del vocabolario da mettere a
disposizione della comunità scientifica. Facendo seguito
all'inventario delle radici del francese presentato nei Cahiers de
lexicologie (Des racines du français et de leur recensement), si
configura come una banca dati lessicografica elettronica ordinata
ed indicizzata delle “radici” a partire delle quali si sviluppa il
lessico. Una grande banca dati a cui ognuno, studente o
ricercatore, possa attingere per trovare riscontro alle sue proprie
problematiche che esse siano sincroniche, diacroniche, didattiche,
comparative, contrastive, traduttologiche ecc. Sul versante della
ricerca questo cantiere sempre aperto e sempre in evoluzione mira
ad approfondire il ritratto morfemologico del vocabolario francese
sul piano statistico quanto sul piano analitico. Di indole
cognitivista, l'unico a priori teorico che lo anima è la
convinzione che il lessico, meglio i lessici di tutte le lingue,
per immensamente popolati che siano, sono territori relativamente
ordinati attorno ad un numero relativamente contenuto di « radici »
che incombe censire in sincronia. Che i lessici, seppure su
un'altra scala, reggono anche loro su un « pigro » principio di
economia funzionale e di « motivazione » adatti ai parlanti che ne
i dizionari “alfabetici” ne i corpus di frequenza di uso
chiariscono del tutto. Che poche migliaia di forme sono più che
sufficienti per garantire tramite derivazione o composizione decine
di migliaia di parole e che è anche uno dei compiti della
lessicografia di tentare di identificare in sincronia, per poi
recuperare anche la diacronia, queste « basi » a partire delle
quali l'attuale vocabolario generale francese è formato. Codesta
disposizione ragionata del lessico si predispone ad innumerevoli
campi di studi di cui sottolineiamo l'analisi quantitativa del
numero approssimativo delle famiglie lessicali de francese,
l'analisi del tasso di « motivazione » virtuale in seno al lessico,
la distribuzione del vocabolario per frequenza d'uso della « radice
» , della distribuzione delle famiglie per « dimensione », della
produttività in derivati di codeste famiglie e la natura
grammaticale di questi derivati, dell'estensione rispettiva delle
famiglie “con verbo” e delle famiglie “senza verbo, della
distribuzione delle famiglie secondo l'« étimologia », del peso
rispettivo e della collocazione delle « basi lessicali con famiglia
» e delle « basi lessicali senza famiglia » che, contrariamente
alle prime non si iscrivono in nessun paradigma lessicale, il
confronto interlinguistico sistematico e generale delle radici, del
l'evoluzione del lessico nella storia costituiscono alcuni dei
campi di analisi, del rapporto tra lessico e memoria cognitiva, tra
lessico glottodidattica e traduzione. Allo stato attuale
dell'elaborazione il lemma che fa capo ad ognuna delle circa 10.600
(provvisorie) famiglie lessicali identificate (di cui circa 3400
“senza famiglia”) contengono diversi indici che nel decorso di
questa ricerca puntiamo a correggere, perfezionare ed arricchire in
particolare grazie all'ausilio del “Trésor de la langue Française”
elettronico. Per ora contiene i seguenti indicatori a partire dei
quale singolarmente o combinati, è possibile, tramite un apposito
programma informatico messo specificamente a punto per questo
scopo, provvedere all'estrazione automatica di interi gruppi di
famiglie lessicali: 1 Frequenza d'uso delle parole, 2 Frequenza
d'uso per suddivisione in 11 categorie di frequenza d'uso, 3
Frequenza d'uso per suddivisione in 6 categorie di frequenza d'uso,
4 Estensione della famiglia (6 modalità, dalle più numerose, ai
vocaboli “senza famiglia”, « fauteuil », « cahier », « hélas » sono
tre dei 3200 “senza paradigma” del francese), 5 Etimologia (anche i
lemmi con etimologia irrisolta sono indicizzati) 6 Presenza o meno
di un verbo nell'ambito della famiglia, 7 Presenza o meno di un
prefisso nella famiglia, 8 Presenza o meno di un'alternanza della
forma all'interno della famiglia (indicatore di coesione), 9
Varietà grammaticale o meno della famiglia 10 Origine toponimica o
patronimica eventuale del lemma. 11 Origine onomatopeica del lemma,
12 Registro popolare di lingua. 13 Coincidenza o meno della forma
francese con il corrispettivo morfologico italiano, acconsentendo
di estrarre, per scopi didattici, i vocaboli che contrastano da una
lingua a l'altra sul piano della forma ma non sul piano semantico
come per fauteuil-poltrona. Acconsente altrimenti detto
l'estrazione completa dei “non amici”.)