keresés

2015. május 16., szombat

A XXI. század kihívásai – Boole-operátorok

Sokan megkérdőjelezik napjainkban, hogy lesz-e a könyvtáraknak a jövőben is létjogosultsága a mai fizikai valójukban és jut-e majd a könyvtárosoknak feladat abban a világban, ahol az interneten mindenki számára könnyen hozzáférhetők, és az olyan keresőmotorok, mint a Google segítségével pedig egyszerűen megtalálhatók a keresett, releváns információk.

Már a Pew Kutatóközpont által 2000-ben az amerikai középiskolás diákok körében elvégzett kutatás is azt mutatta, hogy a könyvtár helyett az internet lett a kutatások végzéséhez használt elsődleges eszköz, mivel az utóbbi sokkal kényelmesebb és kevésbé időigényes, mint elmenni a legközelebbi könyvtárba és ott kutatni. 

Immár a könyvtárak, katalógusaik és – a digitalizálásnak köszönhetően – gyűjteményeik egyre nagyobb része is elérhető az interneten, azonban a felhasználók számára sokkal egyszerűbb és ezáltal gyorsabb is a keresőmotorok használata a különféle könyvtári katalógusokban és adatbázisokban való keresésnél (ProQuest 2007). Ennek megfelelően az elmúlt tíz évben elvégzett kutatások (lásd pl. OCLC 2005, 2006) eredményei azt mutatják, hogy az elektronikus információforrások közül a felhasználók a keresőmotorokat – azok közül is kimagaslóan a Google-t – részesítik előnyben, míg az online adatbázisok és a könyvtárak weboldalai jelentősen lemaradnak ebben a tekintetben.

A technológiai fejlődés tehát rendkívül nagy kihívás elé állítja a könyvtárakat. Természetesen a könyvtáros szakemberek sem hagyhatják mindezt figyelmen kívül. Birger Hjørland, a dán Információtudományi Királyi Akadémia professzora, az ismeretszervezés szakértője is megvizsgálta a technológiai fejlődés által a saját szakterülete, vagyis az ismeretszervezés elé állított kihívásokat. Az egyik legújabb cikkében a Boole-féle információ-visszakereső modell helyét és létjogosultságát vizsgálja a modern keresőmotorok által uralt napjainkban.

Az 1990-es évek előtt nagyrészt szakemberek (nevezték őket könyvtárosoknak, kutató könyvtárosoknak, dokumentaristáknak is) végezték a kereséseket a felhasználók kérésére és helyettük az adatbázisokban, melyek a Boole-modellt alkalmazták (pl. MEDLINE, Chemical Abstracts, PsycINFO). Az 1990-es években aztán megjelentek az internetes keresőmotorok (AltaVista, Yahoo, Hotbot), melyek a végfelhasználók általi keresést könnyűvé és ezáltal a Boole-modell alternatívájává tették, majd végül dominánssá is váltak a digitális információk keresésében. A Google megjelenése pedig végképp megváltoztatott mindent, és nem feltétlen azért, mert jobb rendszer, mint a többi.

A Boole-féle információ-visszakereső modell az egyik legkorábban kialakult és leggyakrabban használt klasszikus információ-visszakereső modell, melynek alapját a Boole-algebra és a halmazelmélet adja. A Boole-algebrát George Boole angol matematikus és filozófus (1815-1864) alkotta meg. A Boole-operátorok a kereső-kifejezések közötti logikai viszonyok megadására szolgálnak. A három logikai operátor a következő: ÉS (AND), VAGY (OR), NEM (NOT). Az ÉS (AND) operátor használata azt jelenti, hogy a vele összekapcsolt kifejezések mindegyikének szerepelnie kell a találati halmazban. Ez tehát a halmazok metszetét jelenti. A VAGY (OR) operátor azonban akkor is találathoz vezet, ha az általa összekapcsolt kifejezéseknek csak az egyike fordul elő a találati halmazban. A logikai NEM (NOT) pedig a halmazok különbségét jelenti. 


A Boole-modell egyfajta „exact matching” típusú eljárás, ami azt jelenti, hogy csak a teljes illeszkedést képes kezelni, ellentétben a „best matching” eljárással, amikor a részleges egyezés mértéke is megállapítható és a végeredmény dokumentumok egy rangsorolt listája. Hjørland szerint ebből fakad az, hogy a Boole-modell a legtöbb kritikát kapott információ-visszakereső modell. Mégis úgy véli, hogy a Boole-modellnek van egy nagy előnye a „best matching” technikákhoz képest, méghozzá az, hogy az előbbi esetében a felhasználó teljes mértékben ellenőrzése alatt tudja tartani a keresési folyamatot, míg a keresőmotorok úgyszólván a „felhasználók háta mögött” dolgoznak. Természetesen ez a felhasználótól megfelelő keresési ismereteket, tapasztalatot és tudatosságot igényel, hiszen tisztában kell, hogy legyen a keresés alatt meghozott döntéseinek a következményeivel. A felhasználó persze lemondhat minderről és le is mond a keresőmotorok használatával, azon az áron, hogy nem tudja mi az, amit nem talált meg és miért nem találta meg. Egy átlagos felhasználó által végzett „mindennapi” keresés esetében talán ez nem probléma, viszont egy tudományos célú keresésnél fontos, hogy a felhasználó irányítsa a keresési folyamatot.

Hjørland megvizsgálta a Boole-operátorokkal szembeni kritikák jó részét, és arra jutott, hogy csupán egy tűnik ténylegesen jogosnak: kezdő felhasználók számára nem könnyű a használata. A Boole-féle modell akkor jelenthet rendkívül jó információkeresési technikát, ha a keresést végző személy megfelelő tudással és tapasztalattal rendelkezik. A könyvtár- és információtudományi képzések keretében a hallgatók napjainkban is megtanulják a megfelelő használatát. Azonban a szakemberek által végzett keresés egyértelműen visszaszorult, hiszen ma már a végfelhasználó online hozzáféréssel rendelkezik, és otthonról kényelmesen végezheti a keresést. De ez nem jelenti azt, hogy képes is a különféle információ-visszakereső technikákat jól alkalmazni, hiszen ahhoz ismernie kéne azok gyengeségeit és erősségeit. Egy átlagos felhasználónak ritkán van ideje, lehetősége vagy motivációja, hogy mindezeket megtanulja.

Nagyon sok információ-visszakereséssel foglalkozó szakember ért egyet abban, hogy akkor igazán fejlett és eredményes egy információkereső rendszer, ha a különféle technikákat egymással kombinálva alkalmazza. Ennek megfelelően létezik is továbbfejlesztett, kibővített Boole-modell, amely hasznosítja például a részleges egyezés és a rangsorolás módszerét. Hjørland szerint azonban a fő probléma abban rejlik, hogy a „best matching” technikán alapuló „felhasználóbarát” keresők teljesen kiszorítani látszanak a Boole-modellt, miközben a „best matching” elvet alkalmazó keresők esetében a keresési folyamat nem átlátható, így nem is irányítható.

Bár a modern technológia és a világhálón található információk és információs szolgáltatások sokasága rendkívül nagy kihívás elé állítja a könyvtárakat, nincs minden veszve. A jövőre nézve az említett kutatások is kimutattak egy biztató tényt. A kutatásban résztvevők komoly értéket tulajdonítottak a könyvtárnak, és amennyiben különösen fontos tényező a minőség.


További felhasznált források:

HORVÁTH Tibor, PAPP István: Könyvtárosok kézikönyve 2. : Feltárás és visszakeresés. Budapest : Osiris Kiadó, 2003. p. 150-151. 
BARÁTNÉ HAJDU Ágnes, BABICZKY Béla: Bevezetés az információkereső nyelvek elméletébe és gyakorlatába. Bp.: Universitas kiadó, 1998. 29. p. 
BELKIN, N. J., CROFT, W.B.: Retrieval techniques. In: Annual Review of Information Science and Technology. (1987) vol. 22. p.109-145. 

Nincsenek megjegyzések:

Megjegyzés küldése