Kako su nastali rječnici

Kako su nastali rječnici

Od glinenih pločica do digitalnih baza: zašto su rječnici uopće nastali

Rječnici su nastali iz praktične potrebe za razumijevanjem stranih jezika i očuvanjem znanja. Najstarije poznate liste riječi datiraju iz drevnog Sumera, a kroz tisućljeća su se razvijali od jednostavnih popisa do sveobuhvatnih digitalnih baza podataka koje danas koristi gotovo svaki govornik bilo kojeg jezika.

Zamislite svijet u kojem ne postoji nijedan rječnik. Kako biste naučili strani jezik? Kako biste provjerili značenje nepoznate riječi? Kako biste uopće definirali pojmove kojima se svakodnevno koristite? Rječnici su toliko duboko utkani u naše razumijevanje jezika da je teško zamisliti civilizaciju bez njih. Pa ipak, kroz većinu ljudske povijesti, rječnici kakve danas poznajemo jednostavno nisu postojali.

Povijest rječnika zapravo je povijest ljudske komunikacije, trgovine, znanosti i kulture. Svako razdoblje donijelo je nove potrebe — od sumerskih trgovaca koji su morali bilježiti robu na dvama jezicima, preko srednjovjekovnih redovnika koji su tumačili latinske tekstove, do današnjih jezikoslovaca koji koriste umjetnu inteligenciju za analizu milijuna rečenica. Ovaj članak prati taj fascinantan put od prvih urezanih glinenih pločica do algoritama koji danas oblikuju naše razumijevanje jezika.

Sumerske liste riječi: najstariji preci rječnika

Najstarije poznate liste riječi potječu iz Sumera oko 2300. godine prije Krista. Bile su to dvojezične tablice na glinenim pločicama koje su služile za učenje akadskog jezika i bilježenje trgovačkih pojmova.

U drevnoj Mezopotamiji, kolijevci civilizacije, nastale su prve organizirane liste riječi koje možemo smatrati dalekim precima modernih rječnika. Sumerski pisari koristili su klinasto pismo kako bi na glinenim pločicama bilježili popise riječi organizirane po tematskim skupinama — životinje, biljke, predmeti, zanimanja, dijelovi tijela i geografski pojmovi.

Najpoznatija takva lista je takozvani Urra=hubullu, sumersko-akadski tematski popis koji je sadržavao gotovo 10.000 pojmova raspoređenih u 24 tematske cjeline. Ova lista nije bila organizirana po abecedi — jer sumersko pismo nije imalo abecedu u današnjem smislu — već po značenjskim kategorijama. Jedna pločica mogla je sadržavati nazive različitih vrsta drveća, dok je druga popisivala vrste kamenja ili metala. Sabrano znanje pokrivalo je biljke, životinje, hranu, oruđe, vozila i dijelove tijela — gotovo cjelokupno iskustvo tadašnjeg civiliziranog života.

Zašto su ove liste nastale? Razlog je bio iznimno praktičan. Sumerski jezik postupno je izumirao kao govorni jezik, a zamjenjivao ga je akadski. Međutim, sumerski je ostao jezik administracije, religije i znanosti — slično ulozi latinskog u srednjovjekovnoj Europi. Pisari su morali vladati obama jezicima, pa su dvojezične liste bile ključno obrazovno sredstvo. Učenici u sumerskim školama, poznatima kao edubba, provodili su godine prepisujući i memorirajući ove popise kao temelj svog obrazovanja.

Antički i srednjovjekovni glossari: most između jezika

Rimski i grčki učenjaci stvarali su glosare za tumačenje zastarjelih ili stranih riječi, a u srednjem vijeku samostani su postali središta leksikografske djelatnosti s dvojezičnim i višejezičnim popisima riječi uz latinske tekstove.

U antičkoj Grčkoj i Rimu leksikografija je poprimila nešto drukčiji oblik. Grčki učenjaci poput Aristofana iz Bizanta u 3. stoljeću prije Krista sastavljali su popise rijetkih i zastarjelih riječi iz Homerovih epova, jer su se mnogi izrazi već tada smatrali arhaičnima. Ovi su popisi, poznati kao glossai, služili čitateljima da razumiju klasične tekstove.

Rimljani su preuzeli tu tradiciju. Marko Terencije Varon u 1. stoljeću prije Krista napisao je djelo De Lingua Latina u dvadeset pet knjiga, od kojih je sačuvano tek šest. Ovo enciklopedijsko djelo bavilo se etimologijom, morfologijom i sintaksom latinskog jezika te predstavlja jedan od najvažnijih antičkih lingvističkih tekstova.

S padom Rimskog Carstva i širenjem kršćanstva, samostani su postali čuvari znanja, a s njime i leksikografske tradicije. Redovnici su uz margine latinskih rukopisa zapisivali objašnjenja teških riječi na narodnom jeziku — te bilješke poznate su kao glose. S vremenom su se glose odvajale od izvornih tekstova i okupljale u samostalne zbornike, takozvane glosare.

Jedan od najvažnijih srednjovjekovnih glosara je Elementarium doctrinae rudimentum Papijasa iz 11. stoljeća, koji je bio prvi europski rječnik organiziran približno abecednim redom. Ovaj je korak bio revolucionaran jer je omogućio brzo pronalaženje tražene riječi — nešto što sumerskim listama i antičkim glosarima nije bilo svojstveno.

U 13. stoljeću pojavio se termin dictionarium, koji je prvi upotrijebio engleski učenjak John de Garlandia 1225. godine kao naslov svog popisa latinskih riječi koje su učenici morali naučiti napamet. Taj termin, izveden iz latinske riječi dictio (riječ, izraz), postupno je postao opći naziv za zbirke riječi s objašnjenjima.

Samuel Johnson i revolucija engleske leksikografije

Samuel Johnson objavio je 1755. godine svoj čuveni Dictionary of the English Language, prvo sustavno djelo engleske leksikografije koje je sadržavalo oko 42.773 natuknice s primjerima iz književnosti i koje je ostalo mjerodavnim više od 170 godina.

Prije Johnsona, engleski jezik nije imao autoritativni rječnik. Postojali su manji popisi i rječnici teških riječi, ali ništa što bi obuhvatilo cjelokupno blago engleskog jezika. Robert Cawdrey objavio je 1604. godine Table Alphabeticall, koji se smatra prvim jednojezičnim engleskim rječnikom, no sadržavao je tek oko 2.500 natuknica i bavio se isključivo rijetkim i posuđenim riječima.

Samuel Johnson započeo je rad na svom rječniku 1746. godine, financiran grupom londonskih nakladnika. Zamišljao je da će posao završiti za tri godine — trebalo mu je sedam. Radio je gotovo sam, uz pomoć tek šestorice pisara koji su prepisivali citate, u potkrovlju kuće u ulici Gough Square u Londonu. Rezultat je bio monumentalni rječnik objavljen 15. travnja 1755., koji je sadržavao 42.773 natuknice i više od 114.000 književnih citata.

Johnsonov rječnik donio je nekoliko ključnih novosti. Svaka natuknica popraćena je citatima iz engleske književnosti koji ilustriraju uporabu riječi u kontekstu — od Shakespearea i Miltona do suvremenih pisaca. Ova metoda potkrijepljivanja definicija primjerima iz stvarne uporabe postala je standardom koji je preuzela gotovo svaka kasnija leksikografska tradicija.

Osim toga, Johnson je bio poznat po duhovitim i ponekad subjektivnim definicijama. Riječ lexicographer (leksikograf) definirao je kao "harmless drudge" — bezopasnog robijača. Riječ oats (zob) opisao je kao žitaricu koju u Engleskoj jedu konji, a u Škotskoj ljudi. Te su subjektivne definicije danas kuriozitet, ali Johnsonov je rječnik u cjelini bio monumentalno i iznimno precizno djelo koje je oblikovalo engleski jezik za generacije.

Denis Diderot i enciklopedijski pristup znanju

Denis Diderot i Jean le Rond d'Alembert uredili su između 1751. i 1772. godine monumentalnu Encyclopédie, djelo od 28 svezaka koje je spojilo leksikografiju s enciklopedijskim pristupom i postalo simbol prosvjetiteljstva.

Dok je Johnson sistematizirao riječi, francuski filozofi otišli su korak dalje. Denis Diderot zajedno s matematičarem Jeanom le Rondom d'Alembertom pokrenuo je jedan od najambicioznijih intelektualnih projekata u povijesti — Encyclopédie, ou dictionnaire raisonné des sciences, des arts et des métiers (Enciklopedija ili razumski rječnik znanosti, umjetnosti i zanata).

Ovo djelo, objavljivano od 1751. do 1772. godine, sadržavalo je 71.818 članaka i 3.129 ilustracija raspoređenih u 28 svezaka. Više od 140 suradnika napisalo je članke koji su obuhvaćali sve grane ljudskog znanja — od fizike i matematike do obrtništva i poljoprivrede. Diderot je osobno napisao oko 6.000 članaka.

Encyclopédie je bila više od rječnika ili enciklopedije — bila je manifest prosvjetiteljstva. Njezin cilj bio je, kako je Diderot sam napisao, "promijeniti način na koji ljudi misle". Vlasti i Crkva pokušavale su zabraniti njezino objavljivanje, a Diderot je zbog nje bio čak i zatvoren. Unatoč svim preprekama, djelo je dovršeno i postalo je temelj modernog enciklopedijskog pristupa organizaciji znanja.

Značaj Encyclopédie za povijest rječnika leži u tome što je pokazala da se leksikografski format — abecedni poredak s natuknicama i objašnjenjima — može primijeniti na cjelokupno ljudsko znanje, a ne samo na riječi jednog jezika. Taj je princip utjecao na sve kasnije enciklopedije, uključujući Britannicu i Wikipediju.

Noah Webster: jezik kao temelj nacionalnog identiteta

Noah Webster objavio je 1828. godine An American Dictionary of the English Language s oko 70.000 natuknica, čime je standardizirao američki engleski i odvojio ga od britanskog, uvodeći reformirani pravopis (color umjesto colour, center umjesto centre).

Na drugoj strani Atlantika, američka nezavisnost nije bila samo politička — ona je trebala i jezičnu dimenziju. Noah Webster, učitelj i politički aktivist iz Connecticuta, smatrao je da mlada američka republika mora imati vlastiti jezični identitet, različit od britanskog. Jezik je za njega bio pitanje nacionalnog ponosa i demokratizacije znanja.

Webster je svoje leksikografsko djelo započeo mnogo skromnije — Spelling Book iz 1783. godine (poznat kao Blue-Backed Speller) prodao se u više od 100 milijuna primjeraka i standardizirao američki pravopis. No njegovo životno djelo bio je An American Dictionary of the English Language, objavljen 1828. godine, na čijem je sastavljanju radio punih dvadeset godina.

Websterov rječnik sadržavao je oko 70.000 natuknica — gotovo 30.000 više od Johnsonova. Još važnije, uveo je pravopisne reforme koje su trajno razdvojile američki od britanskog engleskog: color umjesto colour, honor umjesto honour, center umjesto centre, defense umjesto defence. Te promjene Webster je opravdavao logikom, jednostavnošću i američkim narodnim govorom.

Osim pravopisa, Webster je inzistirao na preciznim etimologijama i proučavao je dvadesetak jezika kako bi pratio podrijetlo engleskih riječi. Bio je prvi američki leksikograf koji je sustavno uključivao specifično američke riječi poput skunk, squash i chowder, koje Johnsonov rječnik nije sadržavao.

Danas tvrtka Merriam-Webster, nasljednica Websterova rječnika, ostaje jedan od najutjecajnijih leksikografskih izdavača na svijetu, a prezime Webster u američkom engleskom postalo je sinonim za rječnik.

Hrvatski rječnici: od Vrančića do Akademijina rječnika

Povijest hrvatskih rječnika počinje 1595. godine Vrančićevim petojezičnim rječnikom, nastavlja se Mikaljom, Habdelićem i Belostencem, a vrhunac doseže s monumentalnim Akademijinim rječnikom JAZU koji je nastajao od 1880. do 1976. godine.

Hrvatska leksikografska tradicija jedna je od najstarijih u slavenskom svijetu i započinje u razdoblju renesanse. Faust Vrančić, polihistor i izumitelj iz Šibenika, objavio je 1595. godine u Veneciji djelo Dictionarium quinque nobilissimarum Europae linguarum — Rječnik pet najplemenitijih europskih jezika. Ovaj rječnik obuhvaćao je latinski, talijanski, njemački, "dalmatinski" (hrvatski) i mađarski jezik te sadržavao oko 5.000 natuknica.

Vrančićev rječnik nije bio samo lingvistički priručnik, već i dokaz da su hrvatski humanisti smatrali svoj jezik ravnopravnim s velikim europskim jezicima. Vrančić je svjesno uvrstio hrvatski među latinski, talijanski i njemački — jezike koji su tada imali neupitan kulturni prestiž.

Pola stoljeća kasnije, 1649. godine, Jakov Mikalja objavio je u Anconi djelo Blago jezika slovinskoga ili Slovnik, prvi rječnik koji je sustavno bilježio štokavski ikavski govor. Mikaljin je rječnik sadržavao hrvatske, latinske i talijanske natuknice, a bio je namijenjen prije svega isusovačkim misionarima koji su djelovali na hrvatskom prostoru.

Kajkavsku leksikografiju pokrenuo je Juraj Habdelić s rječnikom Dikcionar ili Reči slovenske z vexega ukup zebrane, tiskanim u Grazu 1670. godine. Ivan Belostenec dovršio je opsežni Gazophylacium, objavljen posthumno 1740. godine, koji je obuhvaćao oko 40.000 natuknica na latinskom i kajkavskom hrvatskom.

No kruna hrvatske leksikografije bez sumnje je Rječnik hrvatskoga ili srpskoga jezika koji je izdavala Jugoslavenska akademija znanosti i umjetnosti (JAZU, danas HAZU). Rad na tom monumentalnom djelu započeo je 1880. godine pod uredništvom Đure Daničića, a završen je tek 1976. — dakle, nastajao je gotovo punih sto godina. Rječnik obuhvaća 23 sveska s ukupno 280.000 natuknica i predstavlja jedno od najopsežnijih leksikografskih ostvarenja u slavenskom svijetu.

Rječnik Autor Godina Jezik/jezici Približan broj natuknica
Dictionarium quinque nobilissimarum Europae linguarum Faust Vrančić 1595. lat., tal., njem., hrv., mađ. 5.000
Blago jezika slovinskoga Jakov Mikalja 1649. hrv., lat., tal. oko 15.000
Dikcionar ili Reči slovenske Juraj Habdelić 1670. hrv. (kajk.), lat. oko 10.000
Gazophylacium Ivan Belostenec 1740. lat., hrv. (kajk.) oko 40.000
Srpski rječnik Vuk S. Karadžić 1818./1852. srp./hrv., njem., lat. 27.000 / 47.000
Rječnik JAZU/HAZU Đuro Daničić i dr. 1880.–1976. hrv./srp. 280.000

Digitalna revolucija: rječnici u doba interneta

Pojavom interneta rječnici su prešli iz tiskanih knjiga u digitalne baze podataka, omogućujući trenutačno pretraživanje, multimedijske sadržaje, suradničko uređivanje i pristup s bilo kojeg uređaja.

Prijelaz iz tiskanog u digitalno izdanje temeljito je promijenio način na koji koristimo rječnike. Dok je Johnsonov rječnik iz 1755. godine težio gotovo devet kilograma, danas se kompletan Oxford English Dictionary — s više od 600.000 natuknica — može pretražiti u djeliću sekunde na pametnom telefonu.

Prva značajna digitalna leksikografska baza bila je projekt COBUILD (Collins Birmingham University International Language Database), pokrenut 1980. godine pod vodstvom britanskog lingvista Johna Sinclaira. COBUILD je prvi sustavno koristio računalne korpuse — ogromne baze stvarnih tekstova — za analizu toga kako se riječi zaista upotrebljavaju, umjesto da se oslanja isključivo na intuiciju leksikografa.

U hrvatskom jezikoslovlju, digitalizacija je donijela projekte poput Hrvatskog jezičnog portala (HJP), koji je besplatno dostupan mrežni rječnik hrvatskoga jezika s više od 120.000 natuknica. HJP je postao nezamjenjiv alat za svakoga tko piše na hrvatskom jeziku — od učenika i studenata do novinara i prevoditelja.

Wiktionary, projekt Zaklade Wikimedia, predstavlja pak koncept suradničkog rječnika u koji doprinosi zajednica korisnika. Ovaj model demokratizirao je leksikografiju, ali istodobno otvorio pitanja o pouzdanosti i stručnosti definicija koje stvaraju volonteri.

Digitalni rječnici donijeli su mogućnosti koje su tiskanim izdanjima bile nedostupne: zvučne zapise izgovora, interaktivne primjere, poveznice između povezanih pojmova, etimološka stabla, frekvencijske podatke o uporabi riječi kroz stoljeća i mogućnost trenutačnog ažuriranja kada se pojave nove riječi ili nova značenja.

Umjetna inteligencija i budućnost leksikografije

Umjetna inteligencija koristi se za automatsko prepoznavanje novih riječi, analizu kontekstualne uporabe i generiranje definicija na temelju milijardi rečenica, čime se ubrzava i proširuje leksikografski rad, ali ne zamjenjuje ljudsku prosudbu.

Umjetna inteligencija donosi možda najdublju transformaciju leksikografije od izuma tiskarskog stroja. Veliki jezični modeli, poput onih na kojima se temelji ChatGPT ili Claude, trenirani su na stotinama milijardi riječi teksta i razvili su sofisticirano razumijevanje jezičnih obrazaca, značenja i konteksta.

Jedna od najzanimljivijih primjena umjetne inteligencije u leksikografiji je automatsko prepoznavanje novih riječi i novih značenja postojećih riječi. Algoritmi mogu pregledati milijune tekstova objavljenih u jednom danu — nešto što nijedan tim ljudskih leksikografa ne može postići — i identificirati riječi koje se pojavljuju s novom frekvencijom ili u novom kontekstu. Tijekom pandemije koronavirusa, primjerice, sustavi su gotovo u stvarnom vremenu pratili pojavu novih pojmova poput "lockdown", "samoizolacija" ili "covidiot".

Osim toga, jezični modeli mogu analizirati kako se značenje riječi razlikuje u različitim kontekstima, registrima i žanrovima. Riječ "oblak" ima drukčije značenje u meteorologiji, informatici i poeziji — i umjetna inteligencija može precizno razlučiti te nijanse na temelju analize milijuna primjera uporabe.

No postoje i ograničenja. Jezični modeli ponekad generiraju naizgled uvjerljive, ali faktički netočne informacije. Etimologije koje predlažu mogu biti pogrešne, a definicije ponekad uprosječuju značenje umjesto da precizno razluče nijanse. Zato vodeće leksikografske institucije — poput Oxforda, Merriam-Webstera ili hrvatskoga Instituta za hrvatski jezik — koriste umjetnu inteligenciju kao alat koji pomaže leksikografima, a ne kao njihovu zamjenu.

Budućnost leksikografije vjerojatno leži u sinergiji ljudske ekspertize i strojne analize. Umjetna inteligencija može obraditi količine podataka koje su ljudima nedostupne, dok ljudi donose prosudbe o kulturnim nijansama, stilskim razlikama i normativnim preporukama koje algoritmi još uvijek ne mogu pouzdano generirati.

Kako rječnici oblikuju jezik i društvo

Rječnici nisu neutralni popisi riječi, već aktivno oblikuju jezičnu normu, nacionalni identitet i društvene vrijednosti, a odluke o uključivanju ili isključivanju pojedinih riječi izazivaju javne rasprave.

Rječnici se često doživljavaju kao objektivni, neutralni registri jezika. No svaki rječnik odražava odluke svojih urednika — koje riječi uključiti, kako ih definirati, koje primjere odabrati. Te odluke nisu samo lingvističke, već i kulturne, političke i društvene.

U hrvatskom kontekstu, pitanje rječnika oduvijek je bilo usko povezano s pitanjem nacionalnog identiteta. Izbor između štokavskog, kajkavskog i čakavskog narječja, pitanje srpsko-hrvatskih jezičnih razlika i debata o purizmima nasuprot posuđenicama — sve su to pitanja koja se u rječnicima materijaliziraju u konkretne odluke o tome koje riječi zaslužuju mjesto u standardnom jeziku.

Na globalnoj razini, uključivanje novih riječi u ugledne rječnike poput Oxford English Dictionary ili Merriam-Webster postalo je medijski događaj. Kada je Merriam-Webster 2019. godine kao "riječ godine" proglasio zamjenicu they u jednini (za osobe koje se ne identificiraju s binarnim rodom), ta je odluka izazvala živu javnu raspravu koja je daleko nadilazila lingvistiku.

Rječnici su, dakle, živi dokumenti koji odražavaju promjene u društvu. Oni bilježe ne samo riječi, već i promjene u vrijednostima, stavovima i načinu života. Upravo zato je povijest rječnika ujedno i povijest kulture — od sumerskih glinenih pločica na kojima su pisari bilježili nazive roba, do digitalnih baza podataka koje u stvarnom vremenu prate kako se jezik neprestano mijenja i razvija.

Izvori

Često postavljana pitanja

Koji je najstariji poznati rječnik na svijetu?+

Najstariji poznati predci rječnika su sumersko-akadske liste riječi urezane na glinenim pločicama, datirane oko 2300. godine prije Krista. Najpoznatija je lista Urra=hubullu, tematski organiziran dvojezični popis koji je sadržavao tisuće pojmova raspoređenih po kategorijama poput životinja, biljaka i predmeta.

Zašto je Vrančićev rječnik važan za hrvatsku kulturu?+

Faust Vrančić objavio je 1595. godine u Veneciji prvi hrvatski tiskani rječnik s pet europskih jezika. Značaj toga djela nadilazi lingvistiku jer je Vrančić svrstao hrvatski jezik uz bok latinskom, talijanskom i njemačkom, čime je potvrdio kulturnu ravnopravnost hrvatskog s prestižnim europskim jezicima.

Po čemu se Samuel Johnsonov rječnik razlikovao od ranijih?+

Johnson je u svoj Dictionary of the English Language iz 1755. godine uveo praksu potkrijepljivanja svake definicije citatima iz engleske književnosti, od Shakespearea do suvremenih pisaca. Ta metoda prikazivanja riječi u kontekstu postala je standardom moderne leksikografije. Rječnik je sadržavao oko 42.773 natuknice.

Kako umjetna inteligencija mijenja izradu rječnika?+

Umjetna inteligencija omogućuje leksikografima automatsko prepoznavanje novih riječi i značenja analizom milijuna tekstova u stvarnom vremenu. Algoritmi prate frekvenciju i kontekstualne promjene pojedinih riječi. Ipak, KI se koristi kao pomoćni alat, a ljudska prosudba i dalje je nužna za kulturne nijanse i normativne preporuke.

Koliko je trajala izrada Akademijina rječnika JAZU?+

Rječnik hrvatskoga ili srpskoga jezika JAZU nastajao je gotovo punih sto godina — od 1880. do 1976. godine. Rad je započeo pod uredništvom Đure Daničića. Konačni rezultat obuhvaća 23 sveska s oko 280.000 natuknica, što ga čini jednim od najopsežnijih leksikografskih ostvarenja u slavenskom svijetu.

Što je Hrvatski jezični portal i zašto je važan?+

Hrvatski jezični portal (HJP) besplatna je mrežna jezična baza s više od 120.000 natuknica hrvatskoga jezika. Dostupan je svima s pristupom internetu i omogućuje trenutačno pretraživanje definicija, etimologija, gramatičkih podataka i primjera uporabe.

Povezani članci

Ne postoji work-life balance: Pitanje je koga žrtvujete dok gradite “uspjeh”Ne postoji work-life balance: Pitanje je koga žrtvujete dok gradite “uspjeh”Vodič kroz tempo, dinamiku i nevidljivu dušu notnog zapisaVodič kroz tempo, dinamiku i nevidljivu dušu notnog zapisaKako su kvintakordi postali tajni kod popularne glazbeKako su kvintakordi postali tajni kod popularne glazbeKako poslodavci traže “motivaciju za 800 eura” dok im najbolji kandidati okreću leđa Kako poslodavci traže “motivaciju za 800 eura” dok im najbolji kandidati okreću leđa JMBG vs. OIB: Zašto je država promijenila identifikacijski kod svakog građaninaJMBG vs. OIB: Zašto je država promijenila identifikacijski kod svakog građanina
Kako su nastali rječnici | kako.hr