Dicționarul limbii române, din dragoste pentru cunoaștere și limba română
Trăim atât de
multe emoții și
petrecem atât de
mult timp
împreună încât
aproape că nu ne
dăm seama că, de
fapt, suntem în
iubire cu limba
română. Acesta a
fost unul dintre
gândurile care
au venit natural
după dialogul cu
Dr. Gabriela
Haja,
responsabil
pentru
Departamentul de
lexicologie-lexicografie
din cadrul
Institutului de
Filologie Română
„A. Philippide“
al Academiei
Române.
Cătălin
Mosoia:
Sunteți un
cercetător
norocos!
Gabriela
Haja: Mă
consider un
cercetător
norocos pentru
că am participat
la redactarea și
la încheierea
primei ediții a
Dicționarului
limbii române,
dicționarul
Academiei
Române, început,
în această
formă, în 1905.
E un mare noroc!
E o șansă!
Cătălin
Mosoia:
Alți cercetători
nu se întâlnesc
cu o asemenea
șansă?
Gabriela
Haja: Nu
mulți, pentru că
lucrările de
acest fel sunt
speciale și
unice în felul
lor. În România
nu există un alt
dicționar de
asemenea
dimensiuni și de
o asemenea
importanță.
Apoi, pentru că
o astfel de
lucrare se
realizează de-a
lungul unor
decenii, în
echipe mari și
cu eforturi pe
măsură. Visul
oricărui
cercetător este
să-și vadă opera
împlinită, dar
la o astfel de
operă participă
generații.
Aceeași istorie
o au și
dicționarele
Academiilor din
Franța sau din
Spania. În plus,
o asemenea
lucrare, odată
încheiată,
trebuie reluată
și actualizată
periodic,
fiindcă lexicul
este în continuă
schimbare. De
pildă,
Dicționarul
Academiei
Franceze a
ajuns la a noua
ediție, începută
în 1986, încă
nepublicată
integral.
Cătălin
Mosoia:
Aveți
sentimentul că
i-ați mulțumit
și pe cei care
au lucrat la
Dicționarul
limbii române
înaintea
dumneavoastră?
Gabriela
Haja: Cred
că da! Știu că
m-am străduit să
ajung la cele
mai bune
definiții, la
cele mai bune
articole. Dar
satisfacția nu-i
a mea personală,
eu sunt doar o
parte dintr-un
mare ansamblu.
Redactările mele
au fost
revizuite de
specialiști cu
experiență, care
m-au și format
de altfel. Apoi,
întregul
material a fost
verificat de
membrii Comisiei
de etimologii,
înainte de a fi
predat la tipar.
Mulțumirea este
că s-a încheiat
o astfel de
operă. Foarte
important
eveniment pentru
o cultură să
aibă un tezaur
încheiat! Când
compara
Dicționarul
cu o catedrală,
acad. Marius
Sala se gândea,
cred, la
catedralele
gotice...
Despre
Dicționarul
nostru
tezaur trebuie
repetate o serie
de lucruri
importante. În
primul rând, el
este legat
strict de
istoria
Academiei
Române. Am
sărbătorit, în
2016, 150 de ani
de la
înființarea
Academiei
Române; tot
atâția ani au
trecut de la
primele
cercetări
lexicografice de
o asemenea
anvergură. În
actul de
întemeiere al
Societății
literare române,
devenită în 1879
Academia Română,
un obiectiv
important era
redactarea unui
dicționar
reprezentativ al
limbii române;
al doilea era
realizarea
gramaticii
limbii române,
care implica și
unificarea
ortografiei; în
fine, alcătuirea
unui tratat de
referință despre
istoria
românilor. Toate
– proiecte care
aveau să aducă
argumente
științifice
pentru unirea
românilor și
pentru
întemeierea
noului stat,
România.
Cătălin
Mosoia:
Ce puteți spune
despre valoarea
Dicționarului
tezaur al limbii
române?
Gabriela
Haja:
Dicționarul
limbii române
(DLR),
supranumit și
Dicționarul
tezaur al limbii
române sau
Dicționarul
Academiei,
este o
certificare
științifică a
identității
naționale.
Același rol îl
are
Dicționarul
Academiei
Franceze,
același rol îl
are
Dicționarul
Academiei Regale
din Spania,
același rol îl
are orice
dicționar tezaur
al unei limbi
realizat sub
egida unei
instituții de
tip academic.
Dicționarul
limbii române
este comparabil
ca importanță cu
Deutsches
Wörterbuch -
început de
frații Jakob și
Wilhelm Grimm și
a cărui
elaborare a
durat peste 100
de ani, cu
Dictionnaire de
l’Académie
Française ori
Oxford English
Dictionary
(OED).
Academia Română
a fost
înființată
printr-un statut
care preciza,
încă la 1866,
când abia se
obținuse unirea
principatelor,
că din Academie
vor face parte
personalități de
excepție din
toate ținuturile
locuite de
români,
Transilvania,
Maramureș,
Bucovina,
Basarabia,
Banat,
Macedonia.
Înființarea
Academiei a fost
un gest de
politică
culturală, dar
și unul de
politică
lingvistică. În
secolul al
XIX-lea elitele
politice, care
erau și oameni
de cultură,
știau că
astfel pot
modela istoria
sau destinul
unei națiuni. Au
știut să își
aleagă bine
modelele.
Cătălin
Mosoia:
Dicționarul
limbii române,
în cifre…
Gabriela
Haja:
Lucrarea are 37
de volume, în
prima sa ediție,
și aproape
18.000 de
pagini, 175.000
de cuvinte și
peste 1.000.000
de citate din
texte românești,
de la
Scrisoarea lui
Neacșu din
Câmpulung (1521)
(și chiar
anterioare
acesteia, din
textele
slavo-române),
până în prezent.
Cătălin
Mosoia:
Care este
structura
dicționarului?
Gabriela
Haja: Încerc
o analogie.
Dicționarul
limbii române
(DLR) este de
mai bine de zece
ori mai mare
decât
Dicționarul
explicativ al
limbii române
(DEX) și,
firește,
cuprinde mult
mai multe
cuvinte, fiindcă
include toate
arhaismele și
regionalismele,
cuvinte
populare, precum
și toate
cuvintele limbii
literare. În
plus, fiecare
sens și subsens
al unui cuvânt
este argumentat
și ilustrat de
citate extrase
din texte
românești scrise
și vorbite
(înregistrate în
atlase
lingvistice, în
glosare, în
culegeri de
folclor ori în
răspunsurile la
chestionare
lingvistice,
precum cel al
lui Hasdeu), de
la primele
atestări până în
prezent sau, mai
precis, până la
data tipăririi
fiecărui volum.
Pe lângă partea
semantică,
fiecare articol
de dicționar
aduce informații
privind uzul
cuvântului,
originea lui,
valorile și
formele
morfologice,
variantele sale,
acolo unde este
cazul,
sinonimele, dar
și relația
semantică pe
care o are,
ierarhic, cu
alte cuvinte.
Cătălin
Mosoia:
Analizați
inclusiv
sensurile care
apar la unii
scriitori?
Gabriela
Haja:
Desigur. Pentru
că, în bună
parte,
Bibliografia DLR
cuprinde opere
literare, pe
lângă vechi
manuale școlare,
tratate de
istorie, tratate
juridice,
publicistică
literară și
cotidiană,
traducerile
făcute până în
prima parte a
secolului al
XIX-lea și multe
altele. Am
ajuns, în
prezent, la
circa 3000 de
titluri. Luăm în
considerare
toate sensurile
speciale,
figurative sau
sensurile nou
introduse ori
chiar creațiile
lexicale ale
unor autori
influenți. Un
exemplu este G.
Călinescu
(1899-1965),
rafinat
modelator de
limbaj.
Dicționarul
limbii române
oglindește
istoria culturii
române văzută
din perspectiva
cuvintelor - și
reflectă limba
vorbită în toate
regiunile
românești. Seria
veche a
dicționarului,
coordonată de
Sextil Pușcariu
(1877-1948),
făcea trimiteri
la cuvinte și
forme din
celelalte
graiuri
românești
(aromâna sau
macedoromâna,
meglenoromâna,
istroromâna).
Dicționarul are
mari dimensiuni
și nu a putut fi
realizat doar de
o echipă. Până
să ajungem la
forma actuală,
au fost mai
multe încercări.
Prima a fost al
lui Bogdan
Petriceicu
Hasdeu
(1838-1907),
care a scris
Etymologicum
magnum Romaniae
(1886-1893).
Însă a ajuns
doar până la
cuvântul
bărbat.
Proiectul
conceput de el
nu putea fi
realizat de un
om. Hasdeu a
vrut să fie
exhaustiv, să
lucreze toate
cuvintele
înregistrate în
scris. Limbajul
popular l-a
interesat mult
și dicționarul e
foarte bogat din
acest punct de
vedere; a fost
primul care a
lucrat cu
chestionare
trimise pe
teren.
Partea
etimologică este
bine dezvoltată.
De fapt, Hasdeu
a lucrat
monografic
fiecare cuvânt,
cu trimiteri la
evoluția și
influențele
mentalităților,
cu numeroase
citate din texte
vechi și
folclorice.
Pentru noi,
cercetătorii
limbii române,
lucrarea lui
rămâne una de
referință, cu
rezervele
critice
obligatorii în
această
întreprindere...
Cătălin
Mosoia:
Cui a trimis
chestionarele?
Gabriela
Haja:
Preoților,
notarilor,
învățătorilor și
de la ei a
primit
răspunsuri
scrise. Toate
acestea se află
depozitate la
Biblioteca
Academiei Române
din București. O
colegă de la
Institutul
nostru se ocupă
tocmai de
salvarea și
editarea acestor
răspunsuri; sunt
9000 de pagini.
Cătălin
Mosoia:
Bogdan
Petriceicu
Hasdeu a fost
primul care a
lansat
chestionarele
pentru
dicționar.
Gabriela
Haja: La
noi, da. Înainte
de el, au lucrat
la primul
dicționar
academic doi
filologi, August
Treboniu Laurian
(1810-1881) și
Ion C. Massim
(1825-1877); ei
aveau formație
latinistă și
susțineau linia
Școlii Ardelene,
exclusiva
latinitate a
limbii române,
scrierea
etimologizantă
și, din această
pricină,
dicționarul lor,
Dicționarul
limbei române
(1871-1876), a
fost respins de
către comisia
care a
supraveghea
lucrarea. Primul
dicționar
finalizat al
Academiei,
publicat de
Laurian și
Massim, a fost
criticat aspru
de cei care
susțineau
scrierea
fonetică și o
dreaptă măsură
în împrumuturile
din latină sau
din franceză. Cu
toate acestea,
este un
dicționar
important pentru
istoria culturii
noastre și
foarte
interesant
pentru
lexicografi.
După încercarea
lui Hasdeu,
dicționarul a
fost încredințat
unui savant
recunoscut nu
doar în țară,
Alexandru
Philippide
(1859-1933).
Academia Română
i-a solicitat
lucrarea în
cinci ani, iar
el, ca unul care
nu lucrase la un
dicționar, a
acceptat.
Trebuie să fac o
paranteză.
Aceasta este
eroarea oricărui
venit din afara
domeniului. Și
este,
întrucâtva, de
înțeles. Am avut
nevoie de
aproape zece ani
ca să deprind
tehnica de lucru
la tezaur, să
redactez și să
revizuiesc
singură; până
atunci, am
lucrat în echipă
cu un senior; la
dicționarele de
felul celui
explicativ sau
al celor
etimologice ori
generale, se
învață mai
repede tehnica
lexicografică,
dar să lucrezi
la tezaur e cu
totul altceva.
Philippide a
făcut câteva
lucruri foarte
importante: a
gândit structura
dicționarului,
metodologia de
lucru și a
căutat modele
europene care
puteau să-i
mulțumească
spiritul critic,
el fiind
recunoscut drept
unul dintre cei
mai aspri
critici în
domeniul
lingvisticii și
al filologiei.
Cătălin
Mosoia: Care
a fost structura
dicționarului
gândită de
Alexandru
Philippide?
Gabriela
Haja:
Cuvântul titlu,
încadrarea
morfologică,
urmează
definiția și
apoi citatele,
firește, cu
menționarea
sursei,
indicații
privind
flexiunea,
variantele
lexicale, în
fine etimologia.
Un cuvânt poate
avea un sens, în
cazurile cele
mai simple, sau,
de cele mai
multe ori, este
polisemantic.
Forma unui
cuvânt și
înțelesurile
sale sunt
determinate
strict de
originea
cuvântului.
Cătălin
Mosoia: O
structură de
arbore, dar la
un moment dat
trebuie să te
oprești. Unde
sau când?
Gabriela
Haja: Ca
lexicograf,
construiești
arborele și te
oprești când
ajungi la frunze.
Frunzele sunt
sensuri
speciale; te
oprești la
sensurile
speciale care au
tendința de a
intra în uzul
general. Nu
lucrezi, decât
în rare cazuri,
sensurile cu
totul
particulare;
pentru că
dicționarul
limbii s-ar
transforma în
dicționarul
limbajelor
literare. Prin
urmare, te
oprești în
momentul în care
sensurile intră
în domeniul
limbajelor
individuale.
Dicționarul nu
este al
limbajelor, ci
este al limbii
române.
Cătălin
Mosoia:
Cum simți lucrul
acesta?
Gabriela
Haja: Toată
lumea vorbește
despre simțul
limbii, pe care
îl ai sau nu...
Criteriile
științifice la
îndemâna noastră
sunt cele
statistice.
Observi în ce
măsură o formă a
unui cuvânt, un
sens al unui
cuvânt, apare în
mai mult de un
stil ori la mai
mulți autori. O
personalitate ca
aceea a lui
Călinescu putea
influența
îndeajuns limba
literară încât
să considerăm
cuvinte create
de el, dar alți
autori, mai
puțin. Ar trebui
oare să
introducem în
dicționar
cuvinte din
limba spargă
(inventată de
poeta Nina
Cassian) sau din
limba leopardă a
lui Virgil
Teodorescu
(1909-1987)? Nu.
Cazul lui Mihai
Eminescu
(1850-1889) este
cu totul altul,
pentru că el a
creat limba
literară modernă
și urmărim cu
atenție maximă
sensurile pe
care le-a dat
cuvintelor.
Acum, că avem o
ediție
electronică
cvasicompletă a
operelor sale,
vom putea fi
siguri că niciun
cuvânt scris de
el nu va lipsi
din a doua
ediție a
dicționarului.
Alexandru
Philippide a
fost într-un fel
nedreptățit de
istoria
dicționarului.
Spun asta pentru
că el a promis
că în cinci ani
termină
dicționarul. Nu
l-a terminat. În
cinci ani
(1899-1904) a
terminat o
treime. Ceea ce
este enorm! Și
mai ceruse
îngăduință încă
zece. Dar nu a
fost înțeles. Nu
poți înțelege,
dacă nu lucrezi
efectiv. Cu
toate că
Philippide a
trimis rapoarte
foarte riguros
argumentate și
bucăți din
manuscris spre
revizie, când
tensiunea dintre
el și Academie
crescuse foarte
mult, a
refuzat să
termine
dicționarul
și a reziliat
contractul,
unilateral.
Philippide a
avut și el
ambiția unui
dicționar
exhaustiv, care
să cuprindă
toate cuvintele,
indiferent de
forma lor,
indiferent dacă
sunt
regionalisme,
arhaisme sau
neologisme.
Manuscrisul
dicționarului a
fost considerat
multă vreme
pierdut. A fost
descoperit, în
1982, de colega
noastră
Carmen-Gabriela
Pamfil și se
găsește la
Biblioteca
Academiei din
Iași, în fondul
A. Philippide.
Noi am digitizat
acest manuscris,
în formă
scanată, și e la
dispoziția
specialiștilor,
din 2015, în
biblioteca
electronică a
DLR, realizată
la Institutul
nostru.
Spuneam că
Alexandru
Philippide a
stabilit
principiile și
metodologia de
lucru.
Altminteri spus,
a stabilit
etapele de lucru
și activitățile:
să pornească mai
întâi de la
documentare, să
fișeze un număr
de lucrări –
texte românești,
de la cele mai
vechi până la
cele
contemporane lui
și, pe baza
acelor citate,
să recupereze
semantica unui
cuvânt. El
pornea de la
principiul
statistic în
stabilirea
listei de
cuvinte lucrate
și a dimensiunii
unui articol de
dicționar.
Philippide a
avut o intuiție
teribilă și de
foarte mare
actualitate: în
momentul în care
tu,
cercetătorul, ai
reușit să
extragi toate
contextele în
care apare un
cuvânt, este
foarte posibil
să rămâi blocat
în prea marea
masă de
informații. Or,
lucrul este
extrem de actual
astăzi, când
lucrăm la
schimbarea
metodelor și a
mijloacelor de
lucru la DLR.
Volumele
dicționarului
publicate până
la utilizarea
calculatorului
au fost scrise
așa cum se
alcătuiau
dicționarele în
secole de mult
revolute, doar
că noi nu
foloseam pana,
ci creionul și
stiloul –
metodele erau
aceleași. Fișele
erau extrase
manual și apoi
repartizate unui
lexicograf spre
verificare și
utilizare.
Manuscrisele se
făceau pe
jumătăți de coli
A4, iar
numărarea
semnelor pentru
verificarea
îndeplinirii
normei lunare se
făcea manual și
prin aproximare.
S-a întâmplat să
influențez
direct
informatizarea
cercetării
lexicografice la
Iași. Când am
fost angajată,
în 1994, în
departament
exista doar o
mașină de scris
Optima, cu car
mare, pe care am
folosit-o să
culeg cuvântul
viață, în două
exemplare -
aceasta a fost
prima mea
sarcină. Dar eu
deja lucrasem cu
niște
calculatoare. Nu
îmi mai amintesc
ce model erau.
Doar că ecranul
era negru și
literele verde
fosforescent, ca
ochiul de pisică
al radioului de
acasă...
Cătălin
Mosoia:
Cât timp ați
lucrat la
cuvântul viață?
Gabriela
Haja: Nu
foarte mult;
eram abia
angajată și am
cules cele o
sută și ceva de
pagini de
dicționar, ca o
dactilografă și
o ucenică.
Colegii mei cred
că au lucrat la
viață mai mult
de un an. Sunt
verbe la care
s-a lucrat doi
sau chiar trei
ani -de exemplu,
vrea/voi,
veni,
lega,
lăsa. Asta
pentru că sunt
foarte complexe
semantic.
Verbele înseamnă
mișcare,
interacțiune,
proces.
Substantivele nu
sunt neapărat
mai simplu de
lucrat și sunt
mult mai
numeroase,
fiindcă tot ceea
ce există și ne
este cunoscut
are un nume,
nu-i așa? Dar
semantismul lor
e mai ușor de
cuprins, fiindcă
reperele sunt
stabile.
Cătălin
Mosoia:
Recapitulând,
structura
dicționarului a
fost gândită de
Alexandru
Philippide.
Gabriela
Haja:
Într-adevăr.
După ce
Philippide a
renunțat la
dicționar, la
sfârșitul anului
1904, lucrarea a
fost dată în
sarcina lui
Sextil Pușcariu,
care în 1907 a
tipărit prima
fasciculă din
litera A. Cu
ajutorul
colegilor lui de
la Cluj, unde a
înființat, în
1919, Muzeul
Limbii Române,
Pușcariu a
reușit să ajungă
până la cuvântul
lojniță.
Cu alte cuvinte,
a preluat cele
aproximativ
500.000 de fișe
culese de echipa
lui Philippide,
așezate pe
sensuri, cu
definiții
scrise, deci a
avut materialul
brut bine
organizat.
Firește, el a
îmbogățit mult
Bibliografia
dicționarului și
a realizat o
operă
admirabilă.
Cătălin
Mosoia:
Înțeleg că la
elaborarea
tuturor acestor
produse s-a
ținut cont de
lucrul anterior.
Gabriela
Haja: Sextil
Pușcariu este
cel care a
preluat de la
Alexandru
Philippide
fișierul și
structura. Între
Philippide și
Pușcariu e o
certă
continuitate.
Pușcariu a putut
publica destul
de repede primul
volum A-B, pe
urmă C, pornind
de la un
material lexical
deja structurat.
Și a lucrat cu o
echipă de
specialiști, e
drept nu foarte
mare, dar
necesară,
fiindcă un
astfel de opus e
dificil de
îndeplinit
solitar. Există
o excepție
totuși:
francezul Émile
Littré. Dar
aceasta e o altă
poveste.
De asemenea,
este cu totul
remarcabil
faptul că, în
anii ’50, când
cenzura
comunistă epura
tot ceea ce
amintea de
Regalitate,
conducerea
Academiei a
decis
continuarea
lucrării lui
Sextil Pușcariu
și recuperarea
întregii
tradiții
lexicografice
anterioare,
precum și
păstrarea în
mare parte a
izvoarelor
textuale
folosite în
exemple –
inclusiv textele
religioase și
literatura
marilor autori.
Se poate face,
de altfel, un
studiu asupra
evoluției
citatelor din
volumele
publicate după
1965. Încât da,
s-a menținut
continuitatea în
elaborarea
Dicționarului
limbii române.
S-a construit o
tradiție pe care
se cuvine să o
respectăm.
Cătălin
Mosoia:
De unde
proveneau banii?
Gabriela
Haja:
Dicționarul a
fost susținut
financiar de
Casa Regală,
începând cu
Etymologicum
magnum Romaniae.
Erau stipendii
pentru
cheltuieli,
tipar,
cumpărarea de
cărți,
retribuții
pentru
colaboratori.
Tiparul se făcea
la ziarul
Universul, în
general. Cât să
însemne acum
șase mii de lei,
cât a solicitat
Philippide
pentru achiziția
de cărți și
cheltuielile de
întreținere?...
Cătălin
Mosoia:
Ce s-a întâmplat
apoi?
Gabriela
Haja: A
venit războiul.
În 1948 Pușcariu
a murit și
curând s-a
întrerupt
lucrul. Între
timp s-a
schimbat
politica, s-a
schimbat
ortografia și
lucrarea a rămas
în așteptare
timp de zece
ani. Abia în
anul 1958, după
ce Academia
Română a fost
restructurată și
devenise
Academia R.P.R.,
au fost numiți
lingviști care
să se ocupe de
dicționar. Acad.
Iorgu Iordan
(1888-1986) a
fost cel care a
preluat
coordonarea
lucrării, în
1949 și i-a
chemat alături,
din 1958, pe
acad. Ion
Coteanu
(1920-1997),
lingvist de
excepție, și,
din 1965, pe
acad. Alexandru
Graur
(1900-1988),
care era un
etimologist
extrem de
talentat. Ei au
fost redactorii
responsabili.
Iorgu Iordan,
fost student al
lui Philippide,
i-a continuat,
direct sau nu,
principiile pe
care, însă, le-a
simplificat și a
renunțat la
echivalarea în
franceză a
definițiilor; de
asemenea, a
mărit
considerabil
lista lucrărilor
de fișat, a
stabilit niște
reguli precise
și a gândit
lucrurile ca
pentru echipe
mari de lucru.
În orice caz,
Dicționarul
limbii române,
în seria nouă,
inițiat de acad.
Iorgu Iordan,
este mai
sistematic și
mai consecvent,
mai unitar din
punctul de
vedere al
normelor de
redactare; noii
redactori
responsabili au
reușit să evite
scăderile seriei
vechi. Totuși,
seria lui
Pușcariu avea
capitolul
privitor la
etimologie mult
mai dezvoltat și
mai explicit. În
seria nouă,
datele
etimologice sunt
abreviate la
maximum și asta
i se impută.
După ce s-au
creat echipele
de lexicografi
la București,
Cluj și Iași
s-au distribuit
literele, la
Iași au fost
lucrate literele
E, L, Ș și V, W,
X, Y.
Cătălin
Mosoia:
Când a fost
tipărit primul
volum?
Gabriela
Haja: Primul
volum din seria
nouă a apărut în
1965. Echipa de
la București a
fost întotdeauna
mai mare și mai
harnică. S-a
lucra - din
2000,
responsabilitatea
lucrării a fost
asumată de acad.
Marius Sala (n.
1932) și acad.
Gheorghe Mihăilă
(1930-2011).
Cătălin
Mosoia:
Ce s-a întâmplat
în 2010?
Gabriela Haja:
Ne-am pus
problema că
dicționarul are
100 de ani
vechime și
primele volume,
primele litere
au fost lucrate
după alte norme
și că e nevoie
să unificăm
dicționarul, să
facem nu
neapărat o a
doua ediție,
deși asta se
conturează,
ediția a doua.
Cătălin
Mosoia:
Lucrați la o
nouă ediție?
Gabriela
Haja:
Actualizăm și
completăm
volumele seriei
vechi după
normele de
redactare ale
seriei noi. După
2011, colegii de
la București au
încheiat un
contract cu o
firmă privată,
care are ca
obiect de lucru,
între altele,
crearea de
interfețe de
scriere pentru
dicționare.
Dacă până în
anul 2000 am
lucrat cu
mijloace
tradiționale,
redactări
manuscrise,
culese în
edituri, apoi,
la calculator, e
obligatoriu să
schimbăm maniera
de lucru. În
lume, nu se mai
fac dicționare
ca în Secolul
Luminilor. Avem
baze de date, o
platformă de
lucru și un
produs. Avem un
lanț tehnologic
în lucrul cu
mijloace
informatice.
Informatizarea
înseamnă nu doar
faptul că
publici on line
un dicționar, ci
și că lucrezi
altfel și cu
alte resurse.
S-a schimbat
fundamental
viziunea. Acesta
este un start
foarte important
în lexicografia
academică
românească.
Cătălin
Mosoia:
Un nou început…
Gabriela
Haja: În
primul rând, vor
fi mult mai
precise
rezultatele
analizelor
statistice. Când
facem fișarea
manual, ea este
una selectivă și
ne poate scăpa
un sens sau, mai
grav, un cuvânt.
De aceea trebuie
să realizăm
niște corpusuri
ale limbii
române pe care
le putem pune la
punct folosind
și tezaurul
digitizat până
acum.
Cătălin
Mosoia:
Ce este un
corpus?
Gabriela
Haja: Un
corpus înseamnă
o colecție
imensă de text
scris. Sau
vorbit. Milioane
de ocurențe ale
unui cuvânt.
Big data!
Despre asta
vorbim. Dacă se
poate, tot ce
s-a scris în
limba română. Pe
de altă parte,
nu-i destul să
ai colecția de
text. Trebuie ca
aceste texte să
fie analizate
morfologic,
sintactic și, pe
cât posibil,
semantic.
Când tu,
lexicograful, ai
un asemenea
corpus, de
fiecare dată
când cauți un
cuvânt, reușești
să l identifici
cu toate
contextele și
formele
morfo-sintactice
și, eventual, cu
sugestii
semantice. În
aceste condiții,
se schimbă
maniera de lucru
la un dicționar:
altfel te
concentrezi
asupra
definițiilor,
altfel poți
modela
dicționarul,
intrăm în altă
eră. Este ca
trecerea de la
flașnetă la CD
player.
Cătălin
Mosoia:
Cum vă imaginați
că saltul acesta
va influența
cititorul de zi
cu zi?
Gabriela
Haja: În
primul rând, va
avea acces la
dicționar.
Pentru că, în
prezent, acest
dicționar, atât
de minunat, este
cvasiinaccesibil,
aș spune.
Tirajele au fost
limitate. În
bibliotecile
academice sau
universitare, nu
merge oricine. A
fost tipărit
într-un tiraj nu
foarte mare, cu
sprijinul Băncii
Naționale,
ediția
facsimilată sau
anastatică a
DLR, reorânduită
în 19 volume; e
frumos editat,
arată bine pe
raft, e foarte
bine să-l
dăruiești sau
să-l primești în
dar ... însă nu
este la îndemâna
publicului larg,
de fapt. Când ne
am gândit să
digitizăm
dicționarul
(încă de prin
2001), exact
asta ne-am
dorit: să devină
cu adevărat
public, să fie
vizibil on-line.
Cititorii de zi
cu zi vor deveni
mai informați
și, poate, mai
înțelepți ori,
măcar, mai
curioși.
Cătălin
Mosoia:
Credeți că o să
treacă 100 de
ani până se va
reuși acest
lucru?
Gabriela
Haja: Nu. În
urmă cu zece
ani, la Iași,
profesorul Dan
Cristea, de la
Facultatea de
Informatică,
Universitatea
„Alexandru Ioan
Cuza“ din Iași,
a inițiat un
proiect de
transpunere în
format
electronic a
Dicționarului
tezaur. În
2007 s-a
alcătuit un
consorțiu între
Universitatea
„Alexandru Ioan
Cuza“ din Iași
și Academia
Română, prin mai
multe institute,
Institutul de
Lingvistică din
București,
Institutul de
Filologie din
Iași, Institutul
de Lingvistică
și Istorie
Literară din
Cluj. Cu alte
cuvinte, toate
institutele unde
a fost elaborat
Dicționarul
limbii române
au fost prinse
în acest proiect
național și lor
li s-au alăturat
Institutul de
Cercetări pentru
Inteligență
Artificială de
la București,
Institutul de
Informatică
Teoretică din
Iași și
Facultatea de
Informatică și
cea de Litere
din Iași. A fost
un moment de
grație prilejuit
de reunirea
grupurilor de
lingviști și
informaticieni.
După trei ani,
am ajuns, prin
instrumentele
construite de
informaticieni
și cu efortul de
corectură al
lingviștilor, la
prima variantă
electronică a
DLR: eDTLR.
Cătălin
Mosoia:
Cum vă
înțelegeați unii
cu alții?
Gabriela
Haja: A fost
greu să găsim
căi de
comunicare între
două domenii
aparent
incongruente.
După ce mi-am
susținut
doctoratul s-a
întâmplat să
asist la o
școală de vară
condusă de
profesorul Dan
Cristea (n.
1951), membru
corespondent al
Academiei
Române, EuroLan,
unde se discută
tendințele noi
în cercetările
din lingvistica
computațională.
Am fost
fascinată pentru
că nu știam de
existența
acestui domeniu,
dar, de cum l-am
descoperit, m-am
înscris imediat
la masterul de
lingvistică
computațională,
tocmai ca să
aflu cum mai
poate fi gândită
lingvistica, cum
se analizează
automat limbajul
natural, ce
înseamnă
procesarea
limbajului și
cum m-ar putea
ajuta pe mine,
lexicograful, să
trec, de la fișa
scrisă manual și
verificată de
cinci ori, la
alt nivel.
Atunci s-au
născut și ideile
de proiecte.
Digitizarea
dicționarului
este un proiect
care a făcut
primii pași în
perioada
2003-2005, la
Institutul de
Filologie
Română. Noi am
încercat,
colaborând cu
Facultatea de
Informatică din
Iași, să găsim
maniera de
digitizare a
dicționarului
tipărit. În
principiu, dai
dicționarul la
cules literă cu
literă, îl
procesezi, prin
diverse tehnici
și programe de
analiză, și apoi
obții produsul.
Ne-am propus să
încercăm altă
manieră, să
scanăm, să
corectăm, să
procesăm. Și am
găsit soluția.
Am publicat în
2005 o carte pe
această temă -
importantă,
pentru că
propune un model
viabil. După
aceea am găsit
noi căi de
comunicare, în
2008 aveam un
consorțiu bine
întemeiat și în
2010 am pus la
punct
principiile
informatice. S-a
construit o
„mașină“ care să
recunoască
structura unui
articol DLR și
să o adnoteze
corect. Prin
urmare, un
program care să
recunoască
structura
dicționarului,
un program care
știe că această
succesiune de
litere
reprezintă
cuvântul titlu
și o etichetează
ca atare, un
program care
știe că ceea ce
urmează este
definiție iar nu
citat și
înregistrează
informația
automat într-o
bază de date
structurată, un
program care
știe că
sensurile A.,
I., 1. se află
în relație de
subordonare și
care poate să mă
ducă de la un
nivel la altul
fără eroare. Și
încă multe...
Eventual, mă
ajută să scriu
un alt
dicționar.
Cătălin
Mosoia:
Înțeleg că
sunteți
fascinată de
ceea ce înseamnă
informatizare.
Gabriela
Haja: Cine
nu ar fi? Peste
tot în lume, la
dicționare
lucrează
lexicografi cu
dublă
specializare,
lingvistică și
filologică, dar
și informatică.
Au început să
crească noile
generații și la
noi.
Cătălin
Mosoia:
Cum ați cuprinde
în câteva
cuvinte problema
digitizării
dicționarului?
Gabriela
Haja:
Primele studii
le-am realizat
în 2003-2005,
iar în 2007-2010
am ajuns la o
primă formă:
eDTLR. Rămâne să
corectăm erorile
de literă care
au mai rămas și
să rezolvăm
problemele pe
care seria
veche, mai
inconsecventă,
le pune
programului de
parsare. Decizia
coordonatorilor
DLR de a scrie
dicționarul
direct în format
bază de date
reprezintă și
cea mai bună
soluție pentru
viitor.
Cătălin
Mosoia:
Când o să-l
publicați?
Gabriela
Haja: Sunt
mai multe
lucruri de
finalizat. Noi,
lexicografii,
avem dorința de
a mai face o
corectură a
textului. Este
nevoie de cel
puțin o lectură
și de corecturi.
Sigur că am
putea să
publicăm eDTLR
și așa, dar
într-un
dicționar ca
acesta nu încape
eroare de
literă. Nu e
permis. Nu
putem.
Dicționarul
Academiei
este reper
pentru
cercetările
lingvistice
serioase. În
tezele de
doctorat din
domeniul
lingvistic nu se
lucrează fără
acest dicționar
sau nu ar trebui
să se lucreze.
Or, dacă
introducem un
zgomot, cum spun
informaticienii,
adică o eroare,
ea este preluată
progresiv, iar
efectul poate fi
dezastruos.
Putem face
următorul
compromis: să
publicăm
paginile
scanate, iar, în
spate, să se
afle formatul
electronic, care
permite
consultări
complexe.
De altfel, din
2010, la
Institutul
nostru se
lucrează la cel
mai amplu corpus
de dicționare
românești în
format
electronic, pe
scurt CLRE.
Proiectul acesta
e un efect al
marelui eDTLR.
CLRE cuprinde,
în prezent, 160
de dicționare,
de la cel mai
vechi (Anonimus
Caransebensiensis,
cca 1650) până
la ultimul DEX.
Suntem în faza
de revizie a
celor aproape 1
000 000 de
cuvinte-titlu,
cât are acum
corpusul. Aceste
cuvinte sunt
puse în legătură
cu
intrările/articolele
din
Dicționarul
limbii române.
Sperăm să avem
mijloacele
tehnice necesare
publicării on
line a
rezultatelor
obținute până în
prezent. Vrem să
lansăm acest
corpus în 2018,
pentru că e un
an special.
Și mai ales
pentru că
lucrările pe
care noi le
realizăm nu sunt
numai ale
noastre. Ele
aparțin, de
fapt, limbii
române, pe care
o slujim, care
trebuie
cunoscută și
pusă în valoare.
Cătălin
Mosoia:
De unde vă
alimentați
această pasiune
pentru cuvinte?
Gabriela
Haja: Iubesc
enorm limba
română. Apoi, am
avut norocul să
întâlnesc oameni
extraordinari în
acest domeniu,
cercetători cu
totul aparte, cu
o excelentă
pregătire
profesională, cu
lucrări
semnificative
pentru domenii
ca filologia,
istoria limbii
literare,
gramatica,
semantica,
lexicologia.
Dar, mai cu
seamă, mânați de
o pasiune
molipsitoare.
Pentru că lucrul
la dicționar
este pasionant:
să urmărești
istoria
folosirii
fiecărui cuvânt,
evoluția lui
semantică,
sensurile
neobișnuite,
farmecul
textelor care te
poate ispiti să
întârzii asupra
lor, în pofida
verificării
citatului... Se
cere să ai
deopotrivă
răbdarea,
precizia,
finețea
restauratorului
și viziunea de
ansamblu a
arhitectului
creator de mari
structuri. Poate
fi înrobitor și
poate fi foarte
frustrant. Tu
ești o rotiță
măruntă într-un
mecanism
copleșitor și
nici nu te chemi
autor, ci,
simplu,
redactor. Am
colegi care au
ostenit 50 de
ani numai la
Dicționarul
limbii române
sau la alte mari
dicționare ale
Academiei, cum
este
Dicționarul
general al
literaturii
române; și
nu au publicat
nicio carte, nu
sunt doctori în
filologie, dar
contribuția lor
este enormă. O
știm noi, cei
care am lucrat
sau lucrăm cu
alături de ei.
Cătălin
Mosoia:
Iubiți limba
română.
Gabriela
Haja: ...
Cuvintele au
fost comparate
cu banii.
Fiindcă ele
circulă asemenea
monedelor.
Adunate
laolaltă,
formează
tezaure. Dar
acum, când totul
– inclusiv
cercetarea – se
măsoară numai în
numere, în
eficiență
economică, după
indicatori care
nu reprezintă
prea mult pentru
cercetătorul
umanist, filolog
al limbii
române, mă
gândesc că suma
cuvintelor unei
limbi nu face
neapărat o
operă. Că
lipsită de
conținut, de
sens, de valoare
intrinsecă, o
lucrare este
ratată, inutilă,
o risipă. Când
am publicat
prima carte,
bunișoară, i-am
arătat-o cu
mândrie mamei.
Care,
înțeleaptă, a
spus doar: Și
tu? Am meditat
la întrebare și
mi-am propus să
public doar ce
cred că este cu
adevărat
important, cu
încredere că
ceea ce e
valoros
dăinuiește.
Chiar spațiul
virtual devine
sufocant din
pricina
milioanelor de
cuvinte și
semne, care tot
circulă, banale,
între noi, cu
viteze tot mai
mari. Încât s-au
dezvoltat noi
instrumente,
capabile să
selecteze
informația
relevantă, să
răspundă
inteligent la
căutările
noastre, să
extragă elemente
utile din cele
mai aparent
nesemnificative
mesaje. Pentru
toate acestea e
nevoie de
resurse pentru
prelucrarea
limbajului
natural. Pe
lângă corpusuri
monolingve ori
multilingve,
paralele, e
nevoie de
lexicoane și mai
ales de
dicționare
complexe precum
este
Dicționarul
limbii române.
Încât, da, e
plin de sens
lucrul la acest
Dicționar. Este
o formă de
iubire.
|