Dokumentų skaitmeninimo techniniai aspektai
5 (100%) 1 vote

Dokumentų skaitmeninimo techniniai aspektai

TURINYS

Įvadas………………………………………………………………………………………………………………………………..5

1. Skaitmeninių bibliotekų ir dokumentų skaitmeninimo pradžia………………………………………..10

1.1. Pirmoji karta: bibliografiniai katalogai………………………………………………………………..14

1.2. Antroji karta: Eksperimentavimas………………………………………………………………………15

1.3. Trečioji karta. institucinio virsmo karta……………………………………………………………….17

1.4. Pirminė reziume……………………………………………………………………………………………….21

2. Skaitmeninių bibliotekų technologinė platforma…………………………………………………………..23

2.1. Dokumentų atrankos principai……………………………………………………………………………27

2. 2. Dokumentų skaitmeninės kopijos kūrimas………………………………………………………….31

2.3. Skaitmeninimas naudojantis tiekėjų paslaugomis…………………………………………………32

2.4. Skaitmeninimo įranga……………………………………………………………………………………….34

2.5 Gauto skaitmeninio vaizdo apdorojimas……………………………………………………………….39

2.6. Skaitmeninio vaizdo formatai…………………………………………………………………………….41

3. Nuo skaitmeninės kopijos iki skaitmeninės bibliotekos………………………………………………….43

3.1. Optinis simbolių atpažinimas (OCR)…………………………………………………………………..45

3.2. Skaitmeninių išteklių valdymo sistemos………………………………………………………………46

3.3. Skaitmeninis ilgaamžiškumas…………………………………………………………………………….48

Išvados……………………………………………………………………………………………………………………………50

Bibliografinių nuorodų sąrašas…………………………………………………………………………………………..53

Technical aspects of digitisation (summary)………………………………………………………………………..56

ĮVADAS

Skaitmeninė biblioteka tai terminas vis dažniau girdimas mokslinėje literatūroje ir populiarioje spaudoje bei radijuje ir televizijoje. Šios sąvokos reikšmė keičiasi ganėtinai greitai, ji įgyja vis naujų pritaikymų tyrinėtojų bei mokslininkų darbuose. Šis terminas atspindi radikaliai naują požiūrį į informacijos naudojimą panaudojant šiandienos informacijos bei kompiuterijos mokslų pasiekimus. Ši sąvoka vis dažniau pakeičia ankstesnes kaip pvz. Virtualioji ar elektroninė biblioteka.

JAV skaitmeninių bibliotekų federacija (Digital library federation) ir jų partneriai savo tyrimų ir darbo eigoje priėjo išvados jog Terminą „Skaitmeninė bibliotekos“ būtina tiksliai apibrėžti ir pasiūlė tokį apibrėžimą: „Skaitmeninės bibliotekos yra organizacijos kurios suteikia išteklius, įskaitant specializuotus darbuotojus, struktūrizuoti, interpretuoti, rinkti, skleisti skaitmeninius leidinius, užtikrinti jų išsaugojimą, suteikti bendruomenei ar bendruomenėms laisvą priėjimą prie jų.“

Šis apibrėžimas pirmą kartą pristatytas 1998 metais ir ne visada tiksliai gali apibrėžti savo objektą, taigi yra keletas apibrėžimų naudojamų įvairiais aspektais. Skaitmeninė biblioteka karatais gali būti suskaitmenintų dokumentų kolekcija patalpinta visiems prieinamoje interneto svetainėje, tai gali būti dokumentų rinkinys saugomas įvairiose laikmenose pvz. kompaktiniame diske, šis terminas kartu gali reikšti konkrečią biblioteką ar archyvą kuriame saugomi leidiniai skaitmeniniame pavidale. Taigi DLF pasiūlytas apibrėžimas labiau nusako ypatumus nei konkretų objektą, Šiuo terminu galima naudotis apibrėžiant skaitmeninių bibliotekų funkcijas ir vystymosi perspektyvas.

Skaitmeninės bibliotekos yra nepaprastai svarbus evoliucijos žingsnis kalbant apie žinių ir informacijos naudojimą, tai reiškinys keičiantis visuomenės komunikaciją su informaciją, mokymosi procesą, laisvalaikio praleidimą. Tokių bibliotekų atsiradimas įgalina mus naudotis dokumentais ir informacija daug efektyviau. Visame pasaulyje įvairių sričių specialistai, akademinės bibliotekos, archyvai ir kitos organizacijos perspektyvoje siekia sukurti masyvias ir išsamias leidinių kolekcijas kuriomis mokslininkai ir studentai galėtų naudotis daug paprasčiau ir prieinamiau nei įprastų knygų masyvais. Tačiau kuriant tokius išteklius susiduriama su įvairiomis kliūtimis kaip pavyzdžiui ekonominiai ištekliai, Iki šiol vykdyti įvairias skaitmeninimo programas galėdavo išsivysčiusių šalių bibliotekos, universitetai ir organizacijos, tuo tarpu trečio pasaulio šalys yra varžomos ekonominių išteklių, reikalingų norint įgyvendinti tokius projektus, trūkumu. Globaliniu aspektu įvairių šalių
organizacijos, bibliotekos, archyvai dažniausiai vykdo savarankiškus projektus ir programas, bendradarbiavimas tarp jų nėra pastovus ir konkretus, susiduriama su tarp-organizaciniais barjerais. Dar viena problema su kuria susiduriama yra intelektinių bei autorinių teisių klausimas, norint padaryti leidinius skaitmeniniam pavidale prieinamus visiem vartotojam, tarkim interneto pagalba, reikia išspręsti autorinių teisių ginčus. Galiausiai egzistuoja skirtingos nuomonės apie įvairias technologijas ir technines galimybes pritaikomas skaitmeninių kolekcijų ar bibliotekų kūrimui, nėra vieningų standartų ir techninių sprendimų kurie būtų universalus ir tinkami tokių išteklių kūrimui.

Skaitmeninės bibliotekos ateityje apibudinamos tokiomis charakteristikomis:

• Tai bus išsami informacijos išteklių kolekcija svarbi mokslininkams, mokymui ir savišvietai

• Ištekliai bus prieinami visų lygių vartotojams, naujokams bei ekspertams.

• Ištekliai bus tvarkomi ir valdomi profesionalų kurie matys save kaip pasaulio kultūrinio bei intelektinio paveldo saugotojus.

Taigi tikslas yra plėtoti ir skatinti masinį skaitmeninių bibliotekų ar kolekcijų kūrimą visame pasaulyje ir taip sudaryti sąlygas visuomenei naudotis informacija bet kur ir bet kada (internete) patogiausiu ir efektyviausiu būdu.

Daugybė akademinių ir mokslinių bibliotekų apsiėmė konvertuoti į skaitmeninį pavidalą pačias reikšmingiausias ir svarbiausias savo spaudinių kolekcijas. Tai žymiai pagerina vartotojų priėjimą prie kolekcijų, saugo spausdintų dokumentų rinkinius nuo tolimesnio neigiamo fizinio poveikio, suteikia galimybę naudotis dokumentais mokslo tikslais daug didesniam vartotojų ratui dėka geresnio navigavimo ir dokumentų organizavimo skaitmeninėje terpėje. Nors skaitmeninimas ir yra be galo naudingas akademinėm bibliotekom bei mokslininkam, pats procesas yra brangus ir su juo susiję nemažai teisinių, logistinių ir techninių problemų į kurias reikia atsižvelgti prieš imantis tokios svarbios užduoties. Egzistuoja eilė klausimų su kuriomis neabejotinai teks susidurti bibliotekom ir kitom institucijom nusprendusioms skaitmeninti dokumentų kolekciją plačiai publikai. Kai kurie iš jų yra labai panašūs į tuos su kuriais susiduria bibliotekų darbuotojai atsakingi už fondų plėtra ir priežiūrą, -tai atranka, finansavimas, autorinės teisės, dokumentų apsauga, tačiau jie sudėtingesni nes skaitmeninimas kaip procesas yra naujas ir neįsisavintas reiškinys. Nors mokslinės bibliotekos visuomet vienos iš pirmųjų pritaiko naujas technologijas ir pagerina priėjimą prie savo fondų, vis dar yra problemų susijusių su skaitmeninimu dėl kurių betkuris universitetas turėtų gerai apmastyti prieš imantis tokių projektų.

Svarbiausia priežastis imtis tokio projekto yra priėjimo prie dokumentų radikalus pagerinimas. Pirmieji kas pajus naudą iš skaitmeninimo bus tyrinėtojai ir mokslininkai. Dažnai mokslininkas gali studijuoti ar tirti skaitmenine dokumento kopiją be būtinybės matyti tikra fizinį dokumentą. Tai akivaizdi nauda kuomet tyrinėtojas randasi geografiškai toli nuo dokumento. Dar vienas akivaizdus privalumas tai galimybė tiesiogiai palyginti du dokumentus kurie yra skirtinguose pasaulio vietose. Šiai dienai daug universitetų turi kolekcijas surūšiuotas pagal panašias temas ar kategorijas, suskaitmeninus šias kolekcijas ir sukūrus laisvą priėjimą prie jų, vartotojai galės analizuoti dokumentus lygiagrečiai vienas kito lyg tai jie būtų vienos skaitmeninės kolekcijos dalis. Kai kurie universitetai jau ėmėsi kurti tematiškai susijusias skaitmeninius dokumentų rinkinius, kuriuose kelių universitetų dokumentai prieinami per vieną vartotojo sąsają. Pavyzdžiui „Amerikos kūrimas“ (Making of America) yra bendras Mičigano ir Kornelio universitetų projektas kurio siekiama konvertuoti dokumentus apie JAV socialinę istoriją nuo 1850-ųjų. Panaudojant abiejų universitetų dokumentus projektas suteikė galimybę naršyti ir vykdyti paiešką tarp keturių milijonų puslapių iš Amerikos istorijos. Taigi vietoj to kad naudotis dokumentais abiejų universitetų bibliotekose vartotojas gali tiesiog pasiekti integruotą kolekciją interneto pagalba.

Be nuotolinio priėjimo skaitmeninimas įgalina naudotis dokumentais dvidešimt keturias valandas per parą, septynias dienas per savaitę. Mokslininkams nebereikia laukti specialių kolekcijų skyrių darbo valandų, laukti kol skyriaus darbuotojas suras tam tikrą dokumentą. Iš kitos puses „tai turės pasekmių specialių bibliotekos kolekcijų skyrių darbuotojų vaidmeniui ir pareigoms“ (Hirtlis, 2002, p. 52). Tokių skyrių darbuotojai turės iš naujo persvarstyti savo funkcijas ir pareigas ir pritaikyti jas prie skaitmeninimo ir elektroninės terpės. Šiame amžiuje augant ir populiarėjant internetui vartotojai reikalauja iš universitetu pastovaus ir nuotolinio priėjimo prie dokumentų ir pasiekti tai galima tik skaitmeninimo dėka.

Skaitmeninimas taipogi gali atverti galimybe naudotis dokumentais kurie nėra pasiekiami plačiai publikai. Nemažai leidinių ir spaudinių, ypač senų ir retų, yra tokie trapūs ir pažeidžiami kad negali būti naudojami ir skaitomi įprastu būdu. Aukštos kokybės skaitmeniniai vaizdai (nuotraukos) gali apsaugoti dokumentų rinkinius nuo fizinio naudojimo ir poveikio. Su sąlyga kad
skenavimas ar fotografavimas nepažeis leidinio, jį galima konvertuoti ir padaryti prieinamą plačiai publikai. Naudojant sudėtingas vaizdinės grafikos programas galima pagerinti pažeisto dokumento vaizdą ir tai leisti vartotojui geriau pamatyti informaciją dokumente. Pavyzdžiui Nebraskos, JAV universitete nuo devyniolikto amžiaus buvo saugoma stiklo plokštelių negatyvų, kuriuose užfiksuoti pastatai, kolekcija kuri buvo konvertuota į skaitmeninius vaizdus. Panaudojant skaitmeninės grafikos programas pavyko atskleisti detales vaizduose kurių nebuvo matyti ankščiau. Be to vaizdus galima priartinti ir pamatyti konkrečias dokumento dalis įvairiais rakursais, priartinus vaizdą keliasdešimt kartų galima įžvelgti daugybe detalių. Tokia technologija suteikia galimybe naudotis dokumentais ir žmones su sutrikusiu matymu ar kita regos negalią.

Skaitmeninis konvertavimas atneš naudą ne tik mokslininkams, bet ir viso pasaulio žmonėms kurie galės naudotis leidinių kolekcijomis. Individai kurie domisi istorija, literatūra ar kitomis mokslo sritimis kurie paprastai nesilankytų specialių kolekcijų skyriuose, dabar galės prieit prie pirminių dokumentų klodų. Šie žmonės nebūtinai užsiima moksliniais tyrimais, tačiau būdami istorijos ar literatūros mėgėjai jie galės skaityti retus ir senus dokumentus rekreacijos tikslais. Konvertavimas sudemokratina naudojimąsi leidiniais ir padaro istorija prieinamą visiems. „Kasdien Kongreso bibliotekos Amerikos atminties (American memory) puslapis sulaukia daugiau apsilankymų nei bibliotekos skaityklos. (Smith, 1999, p. 9-10). Skaitmeninimas gali būti labai naudingas mokymosi procese tarp aukštųjų ir kitų mokyklų studentų. Nemažai studentams naudingų skaitmeninių bibliotekų esa organizuotos taip kad būtų nepakeičiamas mokymosi medžiagos šaltinis ir papildas. Vienas iš pavyzdžių –„Skaitmeninė istorija“, tai projektas kuriame dalyvauja Hjustono universitetas, Čikagos istorijos bendrija ir kiti. Projektas suteikia prieiga studentams prie daugelio pirminių mokymosi šaltinių bei prie Multimedia interaktyvių pamokų-prezentacijų apie Amerikos istoriją. Tokie projektai sukuria gyvesnį ir įdomesnį istorijos pojūtį studentams kuriems neužtenka skaityti istorinius tekstus.

Paprastai norint rasti informaciją fonduose ar rinkiniuose reikia naudotis katalogais ir bibliografija, kartais tenka peržiūrėti visą dokumentų rinkinį. Skaitmeninimas įgalina vartotoją daug paprasčiau ir efektyviau naršyti medžiagą. Kai dokumentai konvertuojami į skaitmeninį pavidalą, dažnai jiems priskiriami metaduomenys tam kad būtų lengviau organizuoti ir ieškoti tarp dokumentų. Kai kurios skaitmeninės kolekcijos leidžia naršyti jas pagal tema, tačiau daugumą kolekcijų galima naršyti naudojant paiešką pagal raktinius žodžius. Metaduomenys pasako kompiuterio programai apie ką yra dokumentas ir tai įgalina nukreipti dokumentą vartotojui pagal jo paiešką. Skaitmeniniuose kolekcijose dažnai naudojamas hiperteksto nuorodos (nuorodos nukeliančios į teksto dalį paspaudimu ekrane) sujungiančios su reliatyviais tekstais ar dokumentais rinkinyje. Šios priemonės ir technologija pagerina paiešką elektroniniame pavidale kelis kartus lyginant su tradiciniais fondais.

Taigi tema „Dokumentų skaitmeninimo techniniai aspektai“ pasirinkta ne atsitiktinai. Manau ši tema yra neatsiejama nuo dabartinių bibliotekininkystės ir informacijos mokslų, ir atspindi naujausius pakitimus ir procesus, kurie įtakoti technologijų vystymosi, keičia bibliotekos ir vartotojų sąveiką. Kitaip tariant skaitmeninimas yra vienas iš reiškinių keičiančių bibliotekos veidą, jos darbo metodus ir ryšį su skaitytoju atsižvelgiant į dvidešimt pirmo amžiaus technologinius pasiekimus.

Darbe siekiama ištirti techninį procesą kurio pagalba daugelio Europos valstybėse ir JAV kuriamos skaitmeninės kolekcijos arba skaitmeninės bibliotekos, bei kiti skaitmeninių dokumentų projektai. Tai procesas kuomet įvairaus tipo dokumentai turintys fizinę forma kaip pavyzdžiui fotografijos, rankraščiai, knygos, paveikslai ir žurnalai ar laikraščiai yra konvertuojami į skaitmeninį pavidalą, norint įgyvendinti įvairius projektus vadinamus skaitmeninėmis kolekcijomis ar bibliotekomis, kurių tikslas yra padaryti prieinamais plačiai visuomenei ar net visam pasauliu vertingus mokslui, menui ir mokymui dokumentus. Tokius projektus šiandien vykdo didelis skaičius mokslinių bibliotekų, universitetų ar net privačių kompanijų.

Darbo tikslas yra ištirti dokumentų skaitmeninimo techninių sprendimų seką ir įvairovę, apimant bibliotekose vykdomas skaitmeninimo programas ir projektus, susikoncentruojant ties tekstinę ar vaizdinę informacija nešančiais dokumentais tokiais kaip rankraščiai, knygos, žurnalų straipsniai, iliustracijos ir kitais. Šio tyrimo uždaviniai:

• nustatyti kylančias problemas ir kliūtis konvertuojant dokumentus iš fizinės į skaitmeninę formą;

• nubrėžti tinkamiausius ir priimtiniausius techninius sprendimus ir priemones ar jų komplektus taikant juos skaitmeninimo procese bei padėti numatyti ir planuoti technologijų kitimą ir vystymąsi;

• nustatyti techninių aspektų skaitmeninime kitimo ir vystymosi spartą bei jų tendencijas ateityje;

• palyginti tokių iniciatyvų techninius aspektus ir technologijas naudojamas
Europos sąjungoje su tomis kokios naudojamos Lietuvos bibliotekose.

Darbo pagrindiniai tyrimo metodai yra analizė ir interviu su specialistais.

Darbo pagrindas yra keturi skyriai. Pirmoje dalyje dėstoma skaitmeninimo reiškinio esmė ir jos nauda bei tam tikra raida per pastaruosius dešimtmečius, pristatant įvairius etapus ir pavyzdžius susijusius su dokumentų skaitmeniniu formatavimu bibliotekose ir ne tik. Antroje dalyje makro lygiu apžvelgiama ir tiriama skaitmeninių bibliotekų technologinė platforma skirta palaikyti skaitmeninimą ir jo produktą –skaitmeninius dokumentų resursus. Apžvelgiami įvairių projektų pasirinkti metodai ir problemos, su kuriomis buvo susidurta. Trečioje dalyje tiriamas fizinio dokumento skaitmeninės kopijos kūrimas (toks koks taikomas bibliotekų projektuose) ir įvairios priemonės naudojamos šiam tikslui. Taip pat analizuojama seka žingsnių reikalingų dokumento perkėlimui į elektroninę ar skaitmeninę formą. Čia pateikiama ir Lietuvos bibliotekų patirtis ir priemonės. Ketvirtoje dalyje tiriama paskutinioji skaitmeninių dokumentų valdymo ir organizavimo skaitmeninėse bibliotekose grandis. Taip pat techniniai sprendimai įgalinantis organizuoti skaitmeninius fondus siekiant kuo geresnių rezultatų galutiniams vartotojams bei projektų vadybininkams.

Teoretikai teigia jog dvidešimt pirmame amžiuje bus vykdoma masiška dokumentų skaitmeninimas, kandidatas į JAV prezidentus Al Gore kartą kalbėjo jog galutinis bibliotekininkų tikslas yra konvertuoti svarbiausius žmonijos žinių klodus į skaitmeninį pavidalą tam kad bet kuris pasaulio moksleivis, mokslininkas, studentas ar skaitytojas galėtų naudotis laisvai naudotis jais neišeidamas iš namų interneto pagalba. Toks tikslas sunkiai pasiekiamas tačiau daugybė skaitmeninių kolekcijų kūrimo programų įrodė jog tikslas pasiekiamas. Taigi mano pasirinkti projektai mano nuomonę yra tarp labiausiai vertinamų ir daugiausia dėmesio ir vartotojų sulaukusių projektų. Apžvelgdami juos galime susidaryti išsamų supratimą apie dokumentų konvertavimą kaip reiškinį ir suvokti jo vietą šiuolaikinėje informacijos mokslų sistemoje.

Nuo ko prasidėjo bandymai perkelti įvairius dokumentus į skaitmeninę formą? Nustatysime kokių dokumentų buvo imtasi pirmiausia, kokie techniniai sprendimai buvo naudojami, kaip buvo sprendžiami finansiniai ir teisiniai klausimai, ir kokio atgarsio susilaukė tarp skaitytojų, mokslininkų, studentų.

1. SKAITMENINIŲ BIBLIOTEKŲ IR DOKUMENTŲ SKAITMENINIMO PRADŽIA

Pasaulyje galima rasti nemažai skaitmeninių bibliotekų pavyzdžių, reguliariai vysta konferencijos skirtos šiai temai, taip pat rašoma nemažai knygų, straipsnių ar net ištisų žurnalų apie skaitmenines bibliotekas, kartais galima pamatyti diskusijas ar reportažus per televiziją apie jas. Tokių bibliotekų spartus augimas skatinamas elektroninių leidinių publikavimu ir didelių ir mažų skaitmeninimo projektų kurie perkelia medžiagą iš fizinių dokumentų į skaitmeninę formą. Spartus skaitmeninių bibliotekų koncepcijos ir realybės vystymasis yra dar labiau neįtikėtinas žinant jų gana trumpą istoriją.

Pradėti istorinę diskusiją apie skaitmenines bibliotekas galima nuo keturių asmenų kurių viziją ir veiksmai padėjo pradžią tokio reiškinio užgimimui. Dar 1945 metais Masačiusetso technologijos instituto profesorius Vanevaras Bušas parašė straipsnį moksliniame žurnale Atlantic Monthly apie informacijos perkrova net to meto mokslininkams, straipsnis vadinosi „Kaip mes galime manyti“ (As we may think) jame Daktaras Bušas teigia „Mūsų metodai perduodi ir peržiūrėt mokslinių tyrimų rezultatus yra morališkai pasenę ir šiai dienai visiškai netinka“ Jis pasiūlė keletą techninių sprendimų kurie ateityje galės išspręsti šia problemą. Tuomet jis pasiūlė įsivaizduojamo įrenginio vadinamu Memex koncepciją, tai įrenginys kuriame būtų saugomos individo knygos, užrašai bei medžiaga, ir jais būtų galima naudotis labai sparčiai ir patogiai. Jis įsivaizdavo tai kaip tam tikrą darbastalį ant kurio būtų įtaisytas ekranas per kuri galimą būtų akimirksniu surasti reikiamą tekstą užrašą ar knygą. Profesorius tuomet įsivaizdavo tai ne kaip kompiuterį bet greičiau kaip mikrofilmų skaitytuvą kuris dideliu greičiu galėtu projektuoti vaizdą iš reikiamo dokumento. Jis numatė Memex‘ą kaip asmeninę bylą ar biblioteką kurios pagalbą galima būtų susirast ir naudotis bet kokia knygą keleriopai greičiau ir efektyviau nei imant ją iš lentynos tarkim skaitykloje.

Šiuo metu Jūs matote 30% šio straipsnio.
Matomi 2512 žodžiai iš 8272 žodžių.
Peržiūrėkite iki 100 straipsnių per 24 val. Pasirinkite apmokėjimo būdą:
El. bankininkyste - 1,45 Eur.
Įveskite savo el. paštą (juo išsiųsime atrakinimo kodą) ir spauskite Tęsti.
SMS žinute - 2,90 Eur.
Siųskite sms numeriu 1337 su tekstu INFO MEDIA ir įveskite gautą atrakinimo kodą.
Turite atrakinimo kodą?
Po mokėjimo iškart gausite atrakinimo kodą, kurį įveskite į laukelį žemiau:
Kodas suteikia galimybę atrakinti iki 100 straispnių svetainėje ir galioja 24 val.