keresés

2016. április 17., vasárnap

A tezauruszok kialakulásának előzményei és a korai megjelenési formái

A tezauruszok kialakulásának előzményei

A „tezaurusz” görög eredetű szó, mely az angol nyelvterületen először 1736-ban jelent meg, az Oxford szótár rövidített változatában. A kifejezés jelentése akkoriban a tudás kincsestárát vagy az ismeretek-enciklopédiáját jelölte. A leghíresebb – ebben az értelemben vett tezaurusz – Peter Mark Roget gondozásában készült el 1852-ben „Thesaurus of English Words and Phrases” címen, amelynek felépítése alfabetikus volt, de szisztematikus témakörök szerinti elrendezés is szerepelt benne. 

Egy évszázaddal később a tezaurusz kifejezést már az információ visszakeresésre használt tárgyszólisták megnevezésére alkalmazták, azonban egészen idáig a fogalom többféle megközelítése volt használatos. Kezdetben a tezaurusz többeknél, így Batten és Mooers korai elméleteiben is manuális posztkoordinált rendszerként jelent meg. Ebben a struktúrában az indexelő kifejezéseket anélkül rendelik hozzá a dokumentumhoz, hogy figyelembe vennék a szintaxist, ellentétben a prekoordinált rendszerekkel, ahol az indexelő által összekapcsolják a kifejezéseket egy állandó karaktersorozatba. A posztkoordinált rendszerek sajátossága, hogy a kereső, a kifejezések bármilyen kombinációjával megtalálhatja a releváns elemeket. 

A továbbiakban a tezauruszt a posztkoordináltság helyett az információ visszakeresés szempontjából határozták meg. A szakemberek között egyetértés van abban, hogy az információ visszakereséssel összefüggésben Peter Luhn az IBM munkatársa használta először a kifejezést. Ez az aspektus már jól dokumentált, nemcsak Gilchrist, hanem Vickery, Lancaster és Roberts is ebben a szemléletben készítette el munkáit. Az első tezauruszt valójában egy információ visszakereső rendszer szókincsének ellenőrzésére használták, amelyet a DuPont Szervezet fejlesztett ki 1959-ben. Azonban az első már széles körben is hozzáférhető ellenőrzött szótár az ASTIA volt, amelyet az Amerikai Hadászati Műszaki Információs Központ tett közzé. Ennek szorosan a nyomában, másodikként jelent meg a Vegyészmérnökök Amerikai Intézetének mikrotezaurusza a „Chemical Engineering Thesaurus”

A tezauruszok az 1950-es években többféle „formát öltöttek”. Ebben a legnagyobb szerepet Mortimer Taube, Uniterm rendszere játszotta. A Taube által kifejlesztett struktúra nem ellenőrzött. A dokumentum szövegéből kiválasztott egy tagú, uniterm kifejezések jellemezték a tartalmat, amelyekkel viszont problémák merültek fel a szinonimák, a homonimák és az azonos alakú szavak összefüggésében. Az „unitermek” gyakran eltérő jelentéssel bírtak a szövegkörnyezettől, az alkalmazástól, vagy a nézőponttól függően. A rendszerből hiányoztak a minősítők, így a kifejezések közötti speciális különbségek nem voltak kellően kifejezve. Az unitermek tehát alkalmatlanok voltak az egyedi indexelés és a velük való keresés biztosítására, így a rendszer ebben a formájában nem maradt fenn sokáig, annak ellenére, hogy elméleti szerepe és jelentősége máig ható. 

A Taube által kivitelezett struktúrát végül felváltották azok a szótárak, amelyek már jelentős számú összetett kifejezést is tartalmaznak. Ezekben a korai fogalomtárakban már elkezdték ellenőrizni a szinonimákat, a homonimákat és megjeleníteni a kifejezések közti hierarchikus és asszociatív kapcsolatokat is. A 60-as években váltak szembetűnővé a különbségek a hagyományos tárgyszólisták és a fejlődő tezauruszok között. Bár a tárgyszólistákban is jellemzőek voltak a "Lásd" és a „Lásd még” hivatkozások, de fontos eltérés volt, hogy a tárgyszólistákkal kapcsolatban hiányosak voltak a pontos szabályok a szókincs ellenőrzésére és a fogalmak közötti kapcsolatok kifejezésére. Ebben az időszakban minden tezaurusz kifejezéseket sorolt fel alfabetikus sorrendben. A szabványos forma 1967-ben alakult ki, amikor a Thesaurus of Engineering and Scientific Terms (TEST) megjelent a Mérnökök Közös Tanácsának gondozásában és helyébe lépett a Thesaurus of Engineering Terms of the Engineers Joint Council korábbi verziójának. A TEST-ben már jelen voltak azok a funkciók, amelyek a következő 30 év és a ma tezauruszait egyaránt jellemzik, ide értve az ekvivalenciákat a hierarchikus és az asszociatív kapcsolatokat is. 

Az alfabetikus tezauruszok korai dominanciája

A korai tezauruszok domináns eleme volt a deszkriptorok és a nemdeszkriptorok alfabetikus megjelenítése. A téma áttekintése, illetve a szisztematikus megjelenítés, ha egyáltalán létezett, csak másodlagos fontosságú volt ebben az időszakban. Egy részletes, minősített elrendezést, mint amilyen az enumeratív osztályozási rendszerekben van jelen, túl bonyolultnak és elavultnak tartottak ahhoz, hogy szerepet kapjon az információ visszakeresésben. Ennek ellenére néhány tezaurusznak voltak kezdetleges szisztematikus szakaszai, amelyek tág témakategóriákból álltak. 

A TEST-ben a kifejezések betűrendes felsorolással ̶ meglehetősen jelentős terjedelemben ̶ 690 oldalon keresztül foglalkoztak, illetve külön listán szerepeltették a csúcsdeszkriptorokat, ahol feltűntették a szűkebb értelem minden szintjét. Ezen kívül a TEST-nek volt egy szisztematikus fejezete, ahol 22 tárgyi kategóriát különböztetettek meg, ezen belül egy hierarchia szinttel lejjebb alcsoportok helyezkedtek el. A tezaurusz összes deszkriptorát azonban csak az alfabetikus sorrendben tüntették fel, a szisztematikus rész rovására. 

Sok tezauruszt készítettek el nemzetközi szervezetek, a legismertebb ilyen makrotezaurusz előállítója Jean Viet volt, aki művében már sokkal kifinomultabb tárgyi csoportosításokat szerepeltett. Az ENSZ Makrotezaurusza először 1972-ben jelent meg, jelenleg már az ötödik kiadását használják. Itt a deszkriptorcsoportok megjelenítése főcsoportokat tartalmaz, amelyeket alcsoportokra bontanak, ezeken belül pedig az alcsoportok deszkriptorai további klaszterekre tagolódnak. A tezauruszok ezen formájában a szisztematikus rész jellemzően alárendelt az alfabetikus szekciónak, ahelyett, hogy ez képezné az ellenőrzött szótár velejét. Vagyis a fölé-, alárendelt és kapcsolódó kifejezések csak a betűrendes megjelenítésben vannak feltűntetve. 

A betűrend dominanciája alól kivételt képzett a Medical Subject Headings − gyakran csak MESH-ként emlegetjük − amely az Orvostudomány Nemzetközi Könyvtárának gondozásában jelent meg az 1960-as években. Az orvosi tezauruszban a betűrendes rész nem felelt meg a ma szokásos tezaurusz elrendezésnek, mivel nem mutatta a fölérendelt és az alárendelt kifejezéseket, nem tartalmazott magyarázatokat, szinonimákat és kapcsolódó kifejezéseket. Az alfabetikus rész elsősorban a gráfok mutatójaként szolgált. A MESH-ben a gráfok segítségével azonban kiterjedt hierarchiába rendezve helyezték el a deszkriptorokat, egy témakörön belül általában tíz, illetve néhány helyen még ennél is több szintre bontva a kifejezések reprezentálását. Az ábrázolás során alkalmazott gráfok pontosan kifejezték a hierarchia szinteket és lehetővé tették, hogy a kereső úgynevezett „robbantott” keresést végezzen, ami az adott deszkriptorral indexelt tételek és a kifejezés alatt elhelyezkedő szűkebb értelmű változatok megtalálását és később letöltését is lehetővé tette. Éppen ezért ezt a típusú grafikus megjelenítést a mai napig alkalmazzák a tezauruszok szótári részében. 

A facettás tezauruszok megjelenési formái

Később a facetta analízis alapvetően befolyásolta a tezauruszok fejlődését. Körülbelül egy évtizeddel a tezauruszok kialakulása előtt S. R. Ranganathan kifejlesztett egy innovatív osztályozási technikát. Gondolatai a korai 50-es évekre az Egyesült Királyságban is elterjedtek. Az osztályozás nagyjai közül kikerült ezen új technika kedvelői hozták létre Londonban a Classification Research Group-ot (CRG), hogy megosszák egymással ötleteiket és különböző facettás osztályozási rendszereket dolgozzanak ki számos speciális területen. Az egyik ilyen egyedi a CRG által kivitelezett munka az angol Elektrotechnikai Társaság Könyvtárának készített rendszer volt, amelyet később ̶ index alkalmazása helyett ̶ alfabetikus tezaurusszal támogattak az élvonalbeli információ visszakeresés érdekében. 

Az így kapott tezaurusz 1969-ben jelent meg, ez volt az első olyan ellenőrzött szótár, amely facetta-analízist is használt. A Thesaurofacet-et egy sor hasonló elven alapuló tezaurusz követte, ezek közé tartozott az UNESCO Tezaurusz első kiadása, a BSI ROOT Tezaurusz és a Nemzetközi Menekültügyi Tezaurusz. A tezauruszok ezen változatában facetta analízist használtak a kifejezések közötti kapcsolatok megállapítására és egyidejűleg építették ki a hierarchikus és asszociatív kapcsolatokat. Bliss Bibliográfiai Besorolásának második kiadása nagy hatással volt a fogalmak sorrendjére ebben a tezaurusz stílusban.A facettás tezauruszok egy másik változatában az ismeretek területe a tezauruszban fel a Ranganathan által használt facettákra van felosztva és ezek nem a tárgy mezőben jelennek meg. Ide sorolható a Construction Industry Thesaurus és az Art & Architecture Thesaurus.

Nincsenek megjegyzések:

Megjegyzés küldése