keresés

2016. április 20., szerda

A többnyelvűség kezelésének nehézségei a modern igényeknek megfelelően

A 21. században a többnyelvű eszközök egyre nagyobb teret nyernek, egyre több és színesebb felhasználói csoporthoz jutnak el, akik eltérő kulturális és nyelvi háttérrel rendelkeznek és hasonlóan változatos információtípusokhoz szeretnének hozzájutni. Jorna úgy véli, hogy a többnyelvű tezauruszok leggyakoribb formái jelenleg nem megfelelőek erre a szerepre. Véleménye szerint a többnyelvű eszközök ezen típusának új formájára van szükség. E célból foglalkozik az InfoDEFT nevű kísérleti tezaurusz kialakításával, amit az online tezauruszok lehetséges új modelljének tart. Az InfoDEFT egy szemantikailag strukturált, enciklopédikus jellegű és többnyelvű tezaurusz, amely felhasználható a mesterséges tanulást segítő programok esetében is, ezzel csökkentve az eszköz manuális előállításának költséges mivoltát.  

A többnyelvű információkeresés biztosítására nincs egyszerű és kézenfekvő megoldás. A többnyelvű tezauruszok összetett kialakítási problémáira Hahn és Angelova szerint ideális opció lehet, egy független nyelvi tudásbázis bevezetése, amely közös fogalmi struktúrát alkothatna minden egyes nyelven.

Jorna szerint egy ilyen tudásbázis kiépítése azonban rendkívül költséges lenne, és nagy erejű nemzetközi összefogást kívánna meg. Éppen ezért a problémára inkább a három nyelvű kísérleti tezauruszában az InfoDEFT-ben látja a választ, mely rendkívül hasznosan alkalmazható az információ visszakeresésénél és a felhasználók számára is a tények, kifejezések megértéséhez. Erre a modern értelmezésre Schmitz-Esser EXPO 2000 tezaurusza is rávilágított, de ebben a tezauruszban sajnos nem hívják fel a használó figyelmét az egyes nyelvek közötti kulturális különbségekre. Jorna verziójában azonban az egyes kifejezések szoros ellenőrzése is nagy figyelmet kap. Erre az InfoDEFT-et kialakító csoport facetták alkalmazását találta a legideálisabbnak, vagyis egy olyan szerkezet létrehozását, amely eltér az egyes nyelvektől, ezzel is felhívva a figyelmet a különbségekre, nem csupán a szókészletben, hanem a fogalmi kontextusban is. Jorna három fő sarokpontot határoz meg, amelyek egy jó tezaurusz alapkövei kell, hogy legyenek. Először is a tezaurusznak többnyelvűnek kell lennie, hogy támogassa az információhoz való hozzáférést az egyre inkább globálissá váló információs társadalomban. Másodszor ezeknek a rendszereknek az alfabetikus forma helyett, szemantikailag strukturáltaknak kell lenniük, amivel részben lehetővé vélik a felhasznált nyelvek egyenlő képviselete. Harmadszor, segíteniük kell a felhasználók számára a megértést, a felidézést, és a precíz visszakeresést, a definíciók és a megjegyzések használatával.

Míg a modern információs és kommunikációs technológia megkönnyíti a globális adatok transzferét, ugyanez nem segít a globális kommunikáció megvalósulásában. Jelenleg mind az internet és a nemzetközi vállalkozások is nagyrészt az angol nyelvet használják a nemzetközi kommunikációban, amely problémákat vet fel a kultúrák közötti kommunikációban, az angol anyanyelvűek és a más ajkúak között. A legújabb kutatások szerint, az angol nyelv hamarosan megszűnik uralni a globális kommunikációt, helyét Ázsia és Latin-Amerika egyes nyelvcsoportjai fogják átvenni. A fent említett előrejelzések tükrében, új többnyelvű tezauruszokra lesz szükség, hogy támogassák a későbbi uralkodói státuszt nyerő nyelvcsoportok közötti kommunikációt, illetve a nyugat-európai nyelvekhez kapcsolódó diskurzust.

Manapság számos többnyelvű tezauruszhoz férhetünk hozzá az interneten, vagy a könyvtárak OPAC-jában, valójában  azonban ezek egynyelvű tezauruszok, amelyek két- vagy többnyelvű szótárakkal együtt működnek. A többnyelvű információ visszakereső rendszerek ezen formái gyakran csődöt mondanak, amit igazolni lehet a LISA (Library and Information Science Abstracts) részletes vizsgálatával. A LISA tezaurusza a címkéző kifejezések legnagyobb csoportját angol nyelven tartalmazza, annak ellenére, hogy több, mint 60 ország szakterméséből tartalmaz absztraktokat és teljes szövegű hozzáférést. A LISA-nál minden absztraktot angol nyelvre fordítanak, ami súlyosan ellentmondásos keresési eredményekhez vezet abban az esetben, ha nem adottak a pontos ekvivalensek a nyelvek között. A francia „documentalistes” a német „Dokumentar” és az angol „documentalists” egymás egyenértékű kifejezéseiként vannak feltüntetve a tezauruszban, de különböző keresési eredményekhez vezetnek. A különböző nyelvi változatokra keresve 55, 4, vagy 110 rekordot kapunk. Amennyiben az „information professionals” kifejezéssel keresünk, akkor 3372 rekordot kapunk, azonban a kifejezés nemdeszkriptorával a „documentalists” fogalommal ugyanezt végrehajtva csak 590 rekordot kapunk.  Az ilyen következetlenségek, legyőzhetőek abban az esetben, ha egyenlő hozzáférést nyújtunk minden nyelven, ahelyett, hogy az angol nyelvet részesítenénk előnyben. Ez nem csak a kultúrák és így az emberek közötti egyenlő bánásmódot jelenti, hanem lehetővé teszi, a tezaurusz tárgyainak elfogulatlan kezelését is.

Sajnos minden nyelv egyenlő kezelése a rendszeren belül nem könnyű feladat. Valaha még voltak fizikai korlátai a többnyelvű megjelenítésnek, de mára ezeket le lehet küzdeni az elektronika segítségével. A technológia azonban nem tud győzedelmeskedni a szemantikai egyenértékűség intellektuális problémái fölött. A természetes nyelvek komplexitása, amely minden terminológia része, ritkán engedi pontos ekvivalenciák kialakítását a nyelvek között. Ami igen sok gondot okoz a szemantikailag strukturált tezauruszokban. Ugyanez kevésbé okoz fejtőrést az alfabetikus tezauruszok esetében, de, mint már említettem egy jó tezaurusz nem  is alapulhat ilyen elrendezésen.  

Nincsenek megjegyzések:

Megjegyzés küldése