keresés

2014. május 20., kedd

Digitalizálás- alapismeretek a témáról

A digitalizálás a kulturális emlékezetet őrző intézmények, vagyis a könyvtárak, levéltárak és múzeumok gyűjteménygondozó tevékenységének fontos eleme. Széles körben elérhetővé teszi e gyűjtemények darabjait kutatási, oktatási, művelődési, idegenforgalmi vagy egyéb célokra, és emellett sok esetben az eredeti példány védelmét is szolgálja, hiszen így kevesebbszer kell azt kézbe venni.
Ma már olyan széles körű nemzetközi együttműködések formájában zajlik ez a tevékenység, mint például a European Library, illetve az Europeana, amely az EU országainak közgyűjteményeiben digitalizált kulturális örökség nyilvántartása.

 A digitalizálás technikai folyamata


 A digitalizálás, mint technikai folyamat azt a műveletet takarja, amely során egy más hordozón korábban már megjelent művet (szöveget, képet, hangot) számítógéppel olvasható, kódolt formába teszünk át. Azonban ettől sokkal összetettebb dologról van szó ha digitalizálásról beszélünk. Egy sor stratégiai, gyűjteménykezelési, pénzügyi és egyéb jellegű döntés és cselekedet, melynek az az érdeke, hogy a kulturális örökséget őrző intézmények hanem egy sor stratégiai, gyűjteménykezelési, pénzügyi és egyéb jellegű döntés és cselekedet, annak érdekében, hogy a kulturális örökséget őrző intézmények a feladatkörükben meghatározott küldetésüket minél jobban tudják teljesíteni. 

Szöveg digitalizálása

 A szöveg szószerinti visszaadása fontos, de opcionálisan lehet fontos az az információ is, hogy egy adott nyomtatott szöveg milyen tipográfiával készült. (betűtípus, sortávolság, margók, stb.) Tehát az alapfeladat a nyomtatott vagy írott formában rendelkezésre álló szöveg karaktersorozattá alakítása, és ezen felül bizonyos alkalmazások a tipográfiai információk felismerésére is képesek.
 Nyomtatott (írott) szövegek digitalizálása OCR technológiával történik. OCR: Optical Character Recognition, magyarul optikai karakterfelismerés. Ez a technológia az egyes betűk optikai képét próbálja felismerni és a betűknek megfelelő karakterekké alakítani. A kifinomultabb OCR eljárások a minél pontosabb felismerés érdekében nem csak az egyes betűket veszik figyelembe, hanem a szöveg nyelvét illetve a megadott nyelv szavainak ismeretét is felhasználják a felismerésben. Az OCR programok egy fajtája a kézírás felismerő, aminek a szerepe olyan adatbevitelnél fontos, amikor az adatbevitelnél nem, vagy nem minden esetben használunk billentyűzetet, például digitális tábla, érintő képernyős eszközök.






A felismerési folyamat részei
  • az írás képének beolvasása (scanning);
  • a képen szereplő szövegblokkok, szövegsorok vizsgálata;
  • a blokkokban, sorokban szereplő betűk vagy betűpárok felismerése; és
  • a felismert szöveg ellenőrzése (például helyesírás- vagy nyelvtani ellenőrzés).





A digitalizálás szakaszai: 

  • a digitalizálási projekt megtervezése
  • a digitalizálandó forrásanyag kiválasztása
  • a digitalizálás előkészítése
  • a digitalizálandó dokumentumok kezelése
  • a digitalizálás folyamata
  • a digitalizált anyag hosszútávú megőrzése
  • metaadatok
  • publikáció
  • a szellemi termékekkel és a szerzői joggal kapcsolatos kérdések
  • a digitalizálási projekt irányítása

Hazai digitalizálási projektek

Nincsenek megjegyzések:

Megjegyzés küldése