A magyar szókincs eredete

Szókincsünk jó része ősi (a legelfogadottabb feltételezések szerint finnugor), precízen magyar eredetű, ezt a legjobban a magyar szóbokrokat bemutató Czuczor-Fogarasi féle szótár igazolja, de már az ősmagyar korban magába olvasztott iráni (alán, perzsa stb.), valamint török szavakat. (A mai magyar szövegekben előforduló szavak a tudomány mai állása szerint 80-90%-a finnugor szavakra vezethető vissza; ennek kritikáiról a Magyar nyelv eredete cikkben olvashatóak további részletek.) Más kritikusok szerint a magyar nyelvvel rokon a perzsa és a török is, de a török nyelv a magyarnál később alakult ki. Az ómagyar korban bizonyos számú latin és német elemmel bővült; később (az ómagyarkor végén, Mátyás idején) francia és olasz szavak is megjelentek. A középmagyar korban megerősödött a német nyelv hatása, az oszmán-török hatás azonban a hódoltság elnéptelenedése miatt kevésbé érvényesült. A 19. és különösen a 20. században számos nemzetközi vándorszó került a magyar nyelvbe: az angol mellett például francia és olasz szavak is.

A magyar szókincs nagysága

A magyar nyelv szavainak száma kb. 1 millióra tehető, s így az egyik legnagyobb szókinccsel rendelkező nyelv. E becslés magyarázata: az egymillió úgy jön ki, hogy a helyesírás szabályai szerint a magyar nyelv alapvetően támogatja az összetett szavakat (szemben az angol vagy francia nyelvekkel. A magyar nyelvben bármely tetszőlegesen kiválasztott két főnévből kialakítható egy összetett szó. Pl. ajtó + = ajtófű, melyeknek természetesen csak nagyon kis százaléka ténylegesen része a magyar nyelvnek. Ha az ajtófű szónak nincs is értelme első pillantásra, egy kis kutatással még találhatunk neki: pl. a Küküllő mentén így nevezik azt a növényt, ami a küszöb alól sarjad. Számbeli viszonyok: ha 60 ezer főnévből indulunk ki, ezek tetszőleges kombinációja kb. 3.6 milliárd szót eredményezne. Ennek elenyésző töredéke a valójában a nyelvhez tartozó 1 millió szó.

Az angolban pl. nem szokás egybeírni az ilyen szerkezeteket, így az írott angol nyelv elemzése során kevesebb szót találhatunk, azonban még így is kb 400-600 ezer közötti számú szót; másfelől a német, holland, japán, észt vagy finn nyelvben hasonló szintű az egybeírás, és ezekben szinte korlátlan szókígyók jöhetnek létre (Donaudampfschifffahrtsgesellschaftskapitänsmütze), lásd [1], így ezek hasonló képet mutatnak, mint a magyar nyelv. A szókincset az írott nyelv alapján számbavevő módszer azonban vitatható, ugyanis az egybeírás és a különírás sok esetben csak formai, és nem tartalmi különbséget jelent, azaz új jelentés, új szótári egység úgy is létrejön, ha a két alkotóelemet külön írjuk. Például a szövegszerkesztő angol megfelelője, a word processor külön írandó, s így az íráskép alapján két szó, de a nyelvhasználó számára egy új fogalmi egységet jelent, nem pedig két, a mondatban egymás után következő elemet. (Érdekességképpen megjegyzendő, hogy ilyen alapon például a cseh és a szlovák nyelv igekészletét is duplán kéne számolnunk, mivel egybeírják a tagadószót az igével [nevím, neviem: nem tudom; a „ne” a tagadószó].) Annak ellenére, hogy valójában a szóösszetétel sokkal bonyolultabb jelenség annál, hogy csak formai, pusztán az írásrendszerre vonatkozó és nem a nyelv mélyszerkezetéből adódó szabályrendszernek minősítsük (például a szilárd test és a szilárdtest, a mesterséges intelligenciateszt és a mesterségesintelligencia-teszt egészen mást jelentenek, a törökbúza nem török búza stb.), mint a példák is mutatják, az egybeírt összetett szavak egy szóvá, a különírt összetett szavak két szóvá minősítése csak kritikával és a jelentésre való tekintettel fogadható el, és a becslésnél óvatosnak kell lenni. Ez egyben indokolja a szógyűjtés nehézségét is.

Általában is igaz, hogy egy nyelv szókincse igen nehezen definiálható, miután nem egyértelmű meghatározni, mit nevezünk szónak, illetve mit nevezünk származtatott (képzett) szónak. Emellett a magyarban nehéz eldönteni, mi legyen a ragozott és képzett szóalakokkal, ráadásul arról sem teljes a közmegegyezés, hogy egyes szuffixumok ragok-e vagy képzők, és a velük alkotott szóalakok önálló szótári tételek-e vagy nem. Más szavakkal, a képző és rag fogalmának használata nyelvészeti művekben sem teljesen egységes. Ezen kívül per definitionem a magyar nyelvet beszélik a moldvai csángók is, csak éppen román jövevényszavak tömkelegét használják. Ebben az esetben ezek a román jövevények éppúgy a magyar nyelv szókincsének részét képezik, mint az amerikás magyarok angol nyelvi átvételei, hiszen a magyar nyelv egyik változatát beszélők használják őket. Ezek alapján sokak számára úgy tűnik, értelmetlen és haszontalan próbálkozás megállapítani, hány szóból áll a magyar nyelv szókincse. Mások valamilyen alapművet, pl. az MTA által gondozott és meghatározott ún. irodalmi nyelvet veszik alapul. Megjegyzendő, hogy a teljes szókészletet magában foglaló szótár e pillanatban nincs, az Akadémia által kiadott magyar helyesírás szótárának szószáma 300 ezer szó alatt van, tehát a magyar szavak lehetőleg teljes összegyűjtése még várat magára. Megemlítendő, hogy a világ egyetlen nyelvén sem létezik teljes szótár, az angolt beleértve. Ennek egyik oka a szakszavak sokasága, (pl. bányászat, orvostudomány, számítástechnika), melyeket egyetlen szótárszerkesztő sem képes érdemben olyan szinten megismerni, hogy annak alapján felvehesse őket a szótárba. Érdekes kezdeményezés a debreceni egyetem által szerkesztett végződési szótár, mely végződések szerint csoportosítja a magyar szavakat.


Ezzel együtt, ha elkötelezzük magunkat bármelyik felfogás mellett is arról, hogy mit nevezünk egy nyelvhez tartozónak, és mit nevezünk szónak, és ezt az elvet alkalmazzuk a magyarra ugyanúgy, mint más nyelvekre, könnyen összevethetjük a szókincsét más nyelvekével ebből vagy abból a szempontból.

Amennyiben csak a jel és rag nélküli szavakat vesszük figyelembe, amelyek egy művelt anyanyelvi beszélő passzív szókincsében jelen vannak, a képzett szavak közül pedig csak azokat, amelyek önálló jelentésre is szert tettek, körülbelül 120 000–240 000 szó közti értéket kapunk. Általában a legnagyobb írók, költők aktív szókincse sem haladja meg a 200–250 000 szót.