Ma már olyan széles körű nemzetközi együttműködések formájában zajlik ez a tevékenység, mint például a European Library, illetve az Europeana, amely az EU országainak közgyűjteményeiben digitalizált kulturális örökség nyilvántartása.
A digitalizálás technikai folyamata
A digitalizálás, mint technikai folyamat azt a műveletet takarja, amely során egy más hordozón korábban már megjelent művet (szöveget, képet, hangot) számítógéppel olvasható, kódolt formába teszünk át. Azonban ettől sokkal összetettebb dologról van szó ha digitalizálásról beszélünk. Egy sor stratégiai, gyűjteménykezelési, pénzügyi és egyéb jellegű döntés és cselekedet, melynek az az érdeke, hogy a kulturális örökséget őrző intézmények hanem egy sor stratégiai, gyűjteménykezelési, pénzügyi és egyéb jellegű döntés és cselekedet, annak érdekében, hogy a kulturális örökséget őrző intézmények a feladatkörükben meghatározott küldetésüket minél jobban tudják teljesíteni.
Szöveg digitalizálása
A
szöveg szószerinti visszaadása fontos, de opcionálisan lehet
fontos az az információ is, hogy egy adott nyomtatott szöveg
milyen tipográfiával készült. (betűtípus, sortávolság,
margók, stb.) Tehát az alapfeladat a nyomtatott vagy írott
formában rendelkezésre álló szöveg karaktersorozattá alakítása,
és ezen felül bizonyos alkalmazások a tipográfiai információk
felismerésére is képesek.
Nyomtatott
(írott) szövegek digitalizálása OCR technológiával történik.
OCR: Optical Character Recognition,
magyarul optikai karakterfelismerés. Ez a technológia az egyes
betűk optikai képét próbálja felismerni és a betűknek
megfelelő karakterekké alakítani. A kifinomultabb OCR eljárások
a minél pontosabb felismerés érdekében nem csak az egyes betűket
veszik figyelembe, hanem a szöveg nyelvét illetve a megadott nyelv
szavainak ismeretét is felhasználják a felismerésben. Az OCR
programok egy fajtája a kézírás felismerő, aminek a szerepe
olyan adatbevitelnél fontos, amikor az adatbevitelnél nem, vagy nem
minden esetben használunk billentyűzetet, például digitális
tábla, érintő képernyős eszközök.
A felismerési folyamat részei
- az írás képének beolvasása (scanning);
- a képen szereplő szövegblokkok, szövegsorok vizsgálata;
- a blokkokban, sorokban szereplő betűk vagy betűpárok felismerése; és
- a
felismert szöveg ellenőrzése (például helyesírás- vagy
nyelvtani ellenőrzés).
A digitalizálás szakaszai:
- a digitalizálási projekt megtervezése
- a digitalizálandó forrásanyag kiválasztása
- a digitalizálás előkészítése
- a digitalizálandó dokumentumok kezelése
- a digitalizálás folyamata
- a digitalizált anyag hosszútávú megőrzése
- metaadatok
- publikáció
- a szellemi termékekkel és a szerzői joggal kapcsolatos kérdések
- a digitalizálási projekt irányítása
Nincsenek megjegyzések:
Megjegyzés küldése