,, ... Minden nyelvnek sajátos szerkezete van. Nem lehet gépi fordításról beszélni a nyelvi rendszerek precíz adatai nélkül. Minthogy nincs meg a világ minden nyelvének pontos leírása, így a leíratlanok nem is kerülhetnek bele egy gépi fordításkombinációba. Vagyis, ha működik is a gépi fordítás, az nem azt jelenti, hogy bármilyen nyelvről bármilyen nyelvre azonnal „kidobja” számítógépünk az új szöveget. A nyelvi struktúrákat először össze kell vetni, hogy megállapíthassuk kongruenciájuk mértékét, rokonságukat vagy különbözőségüket. Ez a nyelvészek dolga: lexikológiai, morfológiai, szintaktikai tényezőket vizsgálnak és mérnek, azaz: leírják a nyelvet. Éppen erre a minél pontosabb és minél több nyelvnek a leírására ösztönzi a nyelvészeket a gépi fordítás létrehozatalának ügye. Könnyebb a dolgunk, ha azonos nyelvcsaládbéli nyelveket hasonlítunk össze. Az indoeurópai nyelveknek például csak alany-állítmány kongruenciájuk van, míg anyanyelvünknek van állítmány-tárgyi megegyezése is, minthogy igeragozásunk kétféle: alanyi és tárgyas. Tehát, hiába a nyelvészek próbálkozása, hogy olyan nyelvleírást találjanak, kutassanak ki, amely minden nyelvtanra alkalmazható, ez még eddig nem sikerült. Pedig a Tesnière-féle valencia-dependenciaelmélet, az austini, searli stb. beszédaktusmodellek azzal a céllal készültek, hogy minden nyelvre alkalmazhatóak legyenek. De mindig adódik egy nyelvi rendszer, melyre valamilyen szinten egy-egy modell, leírás nem alkalmazható. Az általános kifejezhetőség elve az, hogy minden nyelv képes minden tartalmat propozíciós szinten (körülírással, metakommunikációval) kifejezni; de nem minden nyelv képes minden illokúció (maga az elmagyarázás) megvalósítására. Egyes törzsi nyelvekben, mint például a szubanuni indiánok nyelvében, nincs illokúciós nyelvi eszköz arra, hogy vizet kérjenek, mert ez náluk nem nyelv-, hanem kultúrspecifikus tény, azaz, akinek vízre van szüksége, az odamegy a patakhoz, és kiszolgálja magát. Tehát ezt a beszédaktust az ő nyelvükben nem analizálhatjuk, mert akként nem is létezik; amit nem analizálhatunk, az nem írható le, ami pedig nem írható le, az nem alakítható át matematikai kóddá. Vagyis géppel nem fordítható le.
Valószínűleg nem egyedülálló a japán nyelv abban a különlegességében, miszerint nem mindegy, hogy ugyanazt a mondatot nő vagy férfi mondja-e. Nem a nyelvtani nemekre gondolok, nem a közlendő tartalma itt a lényeg. Például az „ott jön egy autó” mondatot, amennyiben egy férfi közli japánul valakivel, a mondat végén hozzáteszi a „jo” szócskát, ha nő a beszélő, a „va” kerül a mondat végére – e szócskák külön-külön jelölik a beszélő nemét, nem úgy, mint pl. a szláv, vagy latin nyelvek bizonyos igeragozásainak végződései. Utóbbit el tudom képzelni gépbe táplálva, a nyelvek nyelvtani jellegzetességeiként. De nem tudom elképzelni, hogy amennyiben a gép nem „hallja”, nem „látja” a beszélőt, akkor hogyan tesz ki annak nemére vonatkozó külön jelet a japánban, ha az a célnyelv, viszont a forrásnyelvben nincs semmiféle jelölés a beszélő nemére vonatkozóan?
Nem tudom továbbá, hogyan boldogulna egy gép a szabatosság terén? Itt vannak például a partikulák. Valószínű, hogy Ulrich Engelnek nem volt igaza, amikor magyar-német viszonylatban vizsgálódva azt állította, hogy a magyar partikulaszegény nyelv! A magyar nyelv modalitásával foglalkozott többek között Keszler Borbála, Kiefer Ferenc és John R. Searl is. Mint kiderült, az illokutív partikulák (pl. az -e kérdőszó) magyar sajátosságok! Hogyan lehet a modális alapértékeket programnyelvre írni? Ha partikulákban gazdag nyelvekről fordítunk partikulaszegény nyelvre, komoly félreértések is előfordulhatnak. Ha egy nyelvben nincsenek például árnyaló partikulák, az illető mondatot, amelyben a partikulának fontos szerepe van a beszélő álláspontjából, úgy kell erre a nyelvre fordítani, hogy ezt az álláspontot, árnyalást, vagyis a modalitást valahogy meg kell magyarázni. Hozzá kell tehát valahogy fűzni, hogy: „… mondta udvariasan/mérgesen/kétkedőn…” stb. Valószínűleg a bibliafordításokkal is többek között ez a baj, hiszen ide-oda fordítgatták hol partikulásról partikulátlan nyelvre, hol vissza, miközben akár szöges ellentét alakulhatott ki a szövegekben. De erről az is eszembe jutott, hogy nem minden nyelv számára természetes európai nyelvi gondolkodásunk, ahogyan mi az eseményeket a múltból a jövő felé történő folyamatként osztályozzuk, s megkülönböztetünk igeidőket. A partikulák – legalábbis a németben – éppen így alakultak ki, például a „dann”-ból lett a „denn”. Ugyanakkor olyan nyelvek is vannak, Európán kívül, melyekben nyelvtani kategória nem utal az igeidőre. Tehát azok az emberek másfajta rendben beszélnek az eseményekről, számukra más a fontos, másként tagolják a valóságot, például az idő helyett a cselekvés tárgyának formája és anyaga dönti el az igető változatát. Ezt nehéz megérteni a mi gondolkodásunkkal, márpedig a gépiesítéshez először meg kell ismerni, majd megérteni, leírni, kódolni. Talán érdemes lenne próbálkozni azzal, hogy ne a nyelvek egyetemes jegyeiből induljunk ki akkor, amikor a géppel akarjuk megtaníttatni a nyelveket, hanem azok különbözőségeiből. A modern nyelvészeti és pszichológiai kutatásoknak számos érdekes megállapításaik vannak ezen a területen.
Mindig adódik egy újabb vélemény, egy újabb felfedezés, mindig feltevődik egy újabb kérdés, amelyre az eddigiek alapján nem lehet válaszolni. Érvek és ellenérvek sorakoznak az eredendő, ősnyelv mellett és ellene; a nyelvek különböznek, s ez nehezíti a kommunikációt. Tehát minden törekvés, amely a megértés könnyítésére irányul, fontos, így az is, hogy megpróbálkozzunk a gépi fordítással. Az ezzel kapcsolatos kutatások az USA-ban kezdődtek. Valószínűleg nemcsak a műszaki fejlettség miatt éppen itt, hanem azért is, mert egy, az amerikai deskriptív iskola kutatási módszere, a disztribúciós elemzés gazdag anyaga szolgált a gépi fordítás bázisául. Mégis, a nyelvészek legtöbbje már a hatvanas évek végére rájött, hogy mennyire más az ember az ő nyelvi kreativitásával, mint egy gép. Elvetették abbéli illúziójukat, hogy az emberi agy gépre cserélhető a bonyolult szövegek fordításakor. Noha a szovjet kutatók is világhírű fejlesztéseket tudhattak magukénak, a lelkesedés mindenütt csökkent. Igen, de talán csak nyelvészeti oldalról. Mert a fordítás üzlet is! A számítástechnika meg végképp az! Mára már igen nagy versengés folyik a piacon a fordítási memóriát hasznosító programok, vagy inkább a programozók között. A röviden TM-nek (translation memory) nevezett programok szöveges adatbázisok, melyekben hatalmas kétnyelvű szövegtárakat tároltak. Ezek továbbfejleszthetők. Úgy működnek, hogy a tárolt, kész szövegekből a gép fordítás közben kikeresi a már azelőtt lefordított és betáplált részeket, majd beilleszti őket az új szövegbe. Ez tehát csak a két szöveg megegyező részeivel tehető, azaz, ha a lefordítandó szövegben fellelhetők a korábbiakkal egyforma részek, amelyekre a számítógép találhat mintát. Ha nincs minta, nincs fordítás. A kész szövegeknek pedig előzetesen valahogy az adatbázisba kellett kerülniük. Valószínűleg sokévnyi, fáradságos emberi munkával. Azonban nem hiszem, hogy véglegessé tehető, éppen azért, mert a nyelv egy élő, mozgó, emberfüggő dolog, tehát állandóan változik, alakul, s ezt az alakulást a programnak/szoftvernek követnie kell. Hacsak nem készül el egy olyan változat, amely képes „ellesni” az ember gondolkodását; a nyelvhez, mint nagyon is érzékeny lényhez fűződő érzéseit, elvárásait; szavakhoz, kifejezésekhez való viszonyulását; ezt a sok összetevőjű személyes világot, mely még egyedül az emberé. Ha a kimondott szavak mögül hiányzik az őket tápláló emberi gondolkodás és érzésvilág, akkor azok igazságtartalma is sorvad. Nem tudom, felbontható-e matematikai kódokra, algoritmusokra például az emberi érzelem. Hogyan táplálhatók be az árnyalatok, mi alapján döntse el a gép a szöveg hangulatát; hogyan tud egyéni döntéseket hozni az ízlelgetett lehetőségek alapján? Minden nyelvnek egyéni kulturális történelme, háttere van, amely meghatározza a nyelvi asszociációk jellemző mivoltát. A gépi fordítás csak a szövegek „csontvázát” adhatja meg, ott, ahol a nyelvek között koefficiensek vannak az adekvát mondatjellemzők szempontjából, vagyis ha ezek jelen vannak mind a fordítandó, mind a célnyelvben, a nyelvtani szerkezetbeli különbségtől eltekintve.
Foglalkozni kell az internacionalizmusokkal is. Az internacionalizmus szónak itt egy újabb jelentéséről van szó, nem a nemzetköziség elvéről, hanem olyan szavakat és kifejezéseket nevezünk röviden így, amelyeket sok nyelven hasonlóan mondunk, írunk, s amelyek ezeken a nyelveken ugyanazt jelentik. Ehhez ma már a legkisebb követelmény a legalább négy, de inkább öt-hat nemzeti, világ- illetve kultúrnyelvben való hasonlóság. Az internacionalizmus szakkifejezés alatt tehát egy egyidejű, multilingvális jelenséget kell értenünk, mely része a „rendszerközinek” az interszisztémának, s megjeleníti, képviseli az egyes nyelveket; a nyelvhasználat szempontjából pedig úgy határozhatjuk meg, mint a többnyelvű megérthetőségnek egy elemét. A nyelvészeti kutatások arra irányulnak, hogy az említett szavak java része talán nem is nevezhető internacionalizmusnak, csupán „európaizmusnak”, hiszen a legtöbb esetben latin, görög, vagy görög-latin elemekből alkotott szavakról van szó, ezek pedig kimondottan az európai kultúrtörténet tanúi. Íme, egy példa a sok közül, ahol csupán némi eltérés van a szavak írásmódjában és kiejtésében: magyarul kultúra, angolul culture, németül die Kultur, szerbül, oroszul (és valamennyi szláv nyelven, ha nem vesszük figyelembe a cirill betűket) kultura, olaszul cultura stb.
És akkor itt vannak még az ún. „hamis barátok” (faux amis, false friends, falsos amigos, falsche Freunde) és a pszeudo-internacionalizmusok is, hiszen őket is leginkább egyszerűen az idegen szavak közé, esetleg az internacionalizmusok közé szokás sorolni. A „hamis barátok” olyan szavak, amelyek benne vannak ugyan a nemzetközi nyelvkörforgásban, ugyanolyan vagy nagyon hasonló alakban, de az egyes nyelvekben mégis más-más a jelentésük, tehát csak látszólagos megfelelések. Ezeknek a szavaknak a használatakor lexikai átfedések alakulnak ki, ennek oka a hangi hasonlóság, ugyanis a hasonló hangalakok mintegy sugallják a hasonló jelentéstartalmakat, és ez hibához vezet. Például az angol és a német cold és kalt hideget jelent, ezért a legtöbben az olasz caldo-t is hideg-nek vélik, holott olaszul ez a szó éppen meleget jelent. Vagy például magyarul, szerbül, horvátul a szolid szót többnyire szerény, nem hivalkodó jelentésében használjuk, míg a németben ez erős, szilárd, tartós. A németek az akadémikus kifejezés alatt azt értik, hogy valakinek diplomája van, mi magyarok pedig azt, hogy az akadémia tagja. Ezeket a hamis barátnak nevezett szavakat, szópárokat az internacionalizmusok alcsoportjaként kell kezelnünk, s különös figyelemmel kell követniük őket a nyelvtanároknak, fordítóknak.
A pszeudo- vagyis álinternacionalizmusok tipikusan „angolosan viselkedő” szavak, minthogy kitalálóik és terjesztőik angol mintára alkották meg őket, de az angol nyelvben valójában nem is léteznek. Leginkább jellemzik a reklámok nyelvezetét, de hallhatók a fiatalok zsargonjában, s terjednek a nemzetközi politikai, gazdasági és technikai köznyelvben is. Többnyire keverékképzések, téves fordítások, félrehallások vagy analóg képzések során jönnek létre. Minthogy analóg- és keverékképzések, félrehallások tulajdonképpen csak egyazon nyelvcsaládon belül történhetnek, ezért a magyarban ál-internacionalizmusok nem is nagyon fordulhatnak elő. (Itt csupán az idegen szóhoz kapcsolt magyar igekötő a hasonló jelenség, akkor, amikor az illető idegen szó már tartalmazza az igekötőt, pl. meginvitál – invitál, beinkasszál – inkasszál, kiexportál – exportál stb.) Ha azonban figyelmetlenül fordítunk, még képesek leszünk arra is, hogy „behozzunk” a nyelvünkbe például német keverékképzéseket, mint amilyet nemrég hallottam fiatalok körében: „Add már a hendidet, hadd nézzem meg!” A németek a rádiótelefont nevezik das Handy-nek. Ez a szó nem létezik az angolban, ők az említett tárgyat mobile-nak nevezik. Sok ilyen ál-angol kifejezés terjed a mai fiatal németek nyelvhasználatában, s ezek a szavak élik saját életüket, főnévként kapnak természetesen egy német névelőt, beépülnek a nyelv grammatikai és szemantikai szerkezetébe, igeként ragozhatók stb. Mit lehet ezekkel kezdeni gépi fordításkor? Remélem, nem lesz belőlük hendi(kep), a szó „hátrány”-os jelentésében!
A fordítást végzőket és a lefordított szövegeket szemlélve kétféle fordítás van: ösztönös és tudatos. Egyik sem elég azonban önmagában, amint azt a gyakorta megjelenő leiterjakabok, hamis barátok, nyelvi, stílusbeli, szó-, mondat- és szövegszerkesztési hibák is bizonyítják. Ha az ösztönös fordító a fordítástechnika tudományos részébe is legalább csak belelátna, ha a „tudományos” fordító többet hallgatna nyelvi ösztönére, akkor jobb célnyelvi szövegek jönnének létre egy-egy fordítás során. ..."