Keeleteadlased selgitavad: mitu sõna on eesti keeles?

Igaüks meist on vähemalt korra elu jooksul mõelnud, kui palju sõnu eesti keeles tegelikult on. Kas see on tuhat, sada tuhat või ehk isegi miljon? Küsimus tundub lihtne, kuid keeleteadlastele on see üks kõige keerulisemaid ülesandeid, millele vastamist mõjutavad mitmed definitsioonid ja tehnilised piirangud. Kui sirvime Õigekeelsussõnaraamatut või vaatame Eesti Keele Instituudi andmebaase, näeme tohutut hulka sõnu, kuid “päris” keelekasutus on midagi palju laiemat ja dünaamilisemat. See artikkel süveneb sellesse, kuidas teadlased sõnu loendavad, miks see arv pidevalt muutub ja milline on meie emakeele tegelik ulatus.

Mida me üldse sõnaks peame?

Sõnade loendamise juures on kõige suurem takistus definitsiooni puudumine. Kas “kass”, “kassid”, “kassiga” ja “kassidele” on üks sõna või neli erinevat? Keeleteaduses eristatakse sageli lemmat ehk märksõna ja sõnavormi. Kui loendame ainult algvorme ehk lemmade hulka, jääb arv märksa väiksemaks. Kui aga arvestame kõiki käände- ja pöördevorme, pluss liitsõnu, kasvab potentsiaalne sõnavara peaaegu lõpmatuseni.

Eesti keel on aglutineeriv keel, mis tähendab, et sõnadele saab lisada ohtralt liiteid. See annab meile tohutu loomingulise vabaduse. Me võime moodustada täiesti uusi sõnu, mida pole kunagi varem kirja pandud, kuid iga eesti keelt kõnelev inimene saab neist koheselt aru. Just seetõttu on eesti keele sõnavara teoreetiliselt piiramatu.

Keelekorpused kui teaduse alustala

Tänapäeva keeleteadus ei tugine enam ainult paksudele raamatutele, vaid digitaalsetele korpustele. Eesti keele ühendkorpus on tohutu andmekogu, mis koosneb ajalehtedest, ilukirjandusest, internetikommentaaridest, seadustest ja suulisest kõnest. Arvutid analüüsivad neid tekste ja loendavad unikaalseid sõnavorme.

Siiski tuleb siin mängu üks oluline nüanss: tekstide mitmekesisus. Kui vaatleme ainult ÕS-i (Eesti õigekeelsussõnaraamatut), näeme seal umbes 100 000 märksõna. See on normatiivne kogu – ehk sõnad, mida peetakse “ametlikult” eesti keelde kuuluvateks. Kui aga vaatame tegelikku keelekasutust suurtes korpustes, tõuseb unikaalsete sõnavormide arv miljonitesse. Suur osa neist on aga tuletised, liitsõnad või juhuslikud nimekujud, mida ei pruugi sõnaraamatust leida.

Liitsõnade võlujõud ja probleemid

Eesti keel on kuulus oma liitsõnade poolest. Me võime liita kokku peaaegu mida tahes, et luua täpne tähendus. Näiteks “koolimaja”, “koolimajaaken”, “koolimajaaknaklaas”. Kas “koolimajaaknaklaas” on eraldi sõna? Keeleteaduslikult on see liitsõna, mis on moodustatud keele reegleid järgides. Sõnaraamatutesse selliseid moodustisi massiliselt ei kanta, sest nende loetelu oleks lõputu.

Just liitsõnade moodustamise reeglid teevadki eesti keele sõnavara piiramatuks. Kui küsite keeleteadlaselt, mitu sõna on eesti keeles, vastab ta sageli: “Sõltub sellest, kas loendame sõnavara mahtu sõnaraamatu järgi või keelekasutuse potentsiaali järgi.” Potentsiaal on lõputu, kuna keel on elav organism.

Aktiivne ja passiivne sõnavara

Kui räägime üksikisikust, on pilt veelgi huvitavam. Keskmine eestlane ei kasuta igapäevaselt 100 000 sõna. Tegelikult on inimese aktiivne sõnavara, mida kasutame rääkimisel ja kirjutamisel, palju väiksem. See jääb tavaliselt 2 000 kuni 5 000 sõna vahele, sõltuvalt haridusest, lugemusest ja elukutsest.

Passiivne sõnavara ehk sõnad, mida me mõistame, kui neid kuuleme või loeme, kuid ise ei kasuta, on tunduvalt suurem – ulatudes 20 000 kuni 50 000 sõnani. Keeleteadlased rõhutavad, et keele rikkus ei peitu mitte selles, kui palju sõnu on teoreetiliselt olemas, vaid selles, kui osavalt me suudame oma aktiivset sõnavara kombineerida, et väljendada nüansse ja mõtteid.

Keeleline muutumine ja uued sõnad

Meie sõnavara ei ole kunagi staatiline. Iga päev tekib juurde uusi termineid: tehnoloogia areng toob kaasa laene inglise keelest, släng areneb ja uueneb, ning mõned vanad sõnad vajuvad unustusse. Need nn arhailised sõnad moodustavad samuti osa meie keelest, kuigi me neid enam ei kasuta.

  • Tehnoloogilised terminid (nt häkkima, striimima)
  • Kultuurilised laenud (nt gurmee, vabaaja-stiil)
  • Uudissõnad (nt omaloomingulised terminid)

Keeleteadlased peavad pidevalt otsustama, millal üks uus sõna on piisavalt kinnistunud, et see “ametlikult” eesti keelde arvata. See on pidev protsess, mis teebki küsimusele “mitu sõna on eesti keeles” vastamise nii keeruliseks – vastus on eilse seisuga erinev kui tänase seisuga.

Sagedusloendid ja nende tähtsus

Lisaks üldisele sõnavarale on keeleteadlaste jaoks olulised sagedusloendid. Need näitavad, milliseid sõnu kasutatakse kõige sagedamini. Huvitav on see, et väike arv sõnu (umbes 100–200) katab ligi 50-60% kogu igapäevasest keelekasutusest. Need on asesõnad, sidesõnad ja kõige tavalisemad tegusõnad nagu “olema”, “tegema”, “minema”.

Kui liigume sagedusloendites allapoole, muutub sõnavara spetsiifilisemaks. See tähendab, et mida laiem on inimese silmaring, seda rohkem ta sagedusloendi alumistest otstest sõnu ammutab. See teebki keele rikkaks – oskus valida õige sõna õigel ajal, selle asemel et jääda kinni vaid 100 kõige sagedasema sõna juurde.

Korduma kippuvad küsimused

Selles rubriigis vastame kõige sagedasematele küsimustele, mis eesti keele sõnavara kohta esitatakse.

Kui palju sõnu peab teadma, et eesti keeles suhelda?

Argiseks suhtluseks piisab umbes 1000–2000 sõnast. Sellega saab hakkama enamikes igapäevastes olukordades, nagu poes käimine või lihtne vestlus sõpradega.

Kas Õigekeelsussõnaraamat (ÕS) sisaldab kõiki eesti keele sõnu?

Ei, ÕS on valikkogu. See ei ole definitsioonilt ammendav ja sinna ei kuulu murdesõnad, liiga spetsiifilised erialaterminid ega väga uued slängiväljendid, mis pole veel keelde kinnistunud.

Miks on eesti keele sõnavara nii suur?

Eesti keel on väga paindlik. Tänu liitsõnade moodustamisele ja rikkalikule tuletussüsteemile saame luua uusi sõnu peaaegu igas olukorras, mis teeb keele teoreetiliselt lõpmatuks.

Kas laensõnad loetakse eesti keele sõnade hulka?

Jah, kui laensõna on eesti keele struktuuriga kohandunud ja seda kasutatakse laialdaselt, loetakse see eesti keele osaks. Keele areng on alati olnud seotud mõjutustega teistest keeltest.

Kuidas arvutid sõnu loendavad?

Arvutid kasutavad algoritme, mis tuvastavad tekstis sõnapiire. Seejärel eemaldatakse korduvad sõnad ja tehakse kindlaks unikaalsete vormide arv. Tulemus sõltub sellest, kas arvuti loendab kõik käänamisvormid või ainult lemmad.

Eesti keele tuleviku perspektiivid

Keele rikkus seisneb meie võimes seda arendada ja hoida. Kuigi numbrid võivad varieeruda, on kõige olulisem tõsiasi, et eesti keel on elujõuline. Meie sõnavara ei ole midagi sellist, mida tuleks klaaskasti panna ja vaid imetleda; see on tööriist, mida me ise iga päev kujundame. Keeleteadlased jätkavad korpuste analüüsimist ja sõnavara kaardistamist, kuid lõpliku vastuse sellele, kui palju on sõnu, annab iga eesti keele kõneleja, kes otsustab kasutada just seda ühte õiget, tabavat või uut sõna.

Teaduslikust vaatenurgast on huvitav jälgida, kuidas digitaalne ajastu mõjutab meie sõnavara kiirenemist. Veebisuhtlus, kus lühidus ja kiirus on esmatähtsad, loob uusi lühendeid ja mugandusvorme. Samal ajal säilitab akadeemiline ja kirjanduslik keel oma sügavuse. Selline duaalsus tagab, et eesti keel püsib nii funktsionaalne kui ka värvikas veel paljudeks sajanditeks. Igaüks meist on keelekandja ja keelelooja ning just see teebki eesti keele nii erakordseks.

Posted in Elu