Prezentare
DACOROMANICA este cea mai importantă bibliotecă digitală românească accesibilă gratuit în INTERNET. Dezvoltarea ei prin îmbogăţirea continuă cu documente digitalizate se face permanent, în fiecare săptămână, pentru a fi un veritabil instrument în serviciul reţelelor de cooperare naţională şi internaţională, precum şi pentru a deveni partener în Biblioteca Virtuală Europeană EUROPEANA. DACOROMANICA este singura bibliotecă digitală profesionistă din România, concepută pentru a răspunde provocărilor Mileniului III.
Informaţii tehnice
Platforma de lucru este aplicația de management a obiectelor digitale DIGITOOL, EXLIBRIS.
Activitatea de digitizare a documentelor şi prelucrarea fişierelor rezultate, atât cele necesare stocării în vederea prezervării, cât şi copiile destinate publicării pe site se desfăşoară conform cerinţelor tehnice şi standardelor în domeniu promovate de forurile europene competente : EUROPEANA.eu, BNF.fr, MINERVA.org
Site-ul oferă posibilitatea realizării căutării în două variante:
• căutare simplă, care permite regăsirea unui termen atât în câmpurile de date bibliografice, cât şi în textele documentelor prezentate în format PDF.
• căutare complexă, disponibilă numai din mediul Digitool, care permite folosirea operatorilor booleeni, căutări combinate în mai multe câmpuri şi rafinarea după formatul fişierelor.
Documentele digitizate sunt realizate şi stocate în format TIFF, la o rezoluţie de cel puţin 300 dpi.
Documentele prelucrate şi publicate pe site în mod imagine, text, audio şi video sunt realizate, după caz, în format PDF, JPEG, JP2000, XML, MP3, MP4.
Descrierea documentelor este realizată pe baza schemei de metadate Dublin Core (simplă şi extinsă).
Schimbul de date se realizează pe baza protocolului OAI-PMH (Open archive initiative-Protocol for metadata harvesting).
Tipuri de documente
DACOROMANICA oferă acces la documente tipărite (monografii, periodice, cărţi poştale, hărţi) în mod imagine şi text, la documente sonore şi vizuale, în mod audio şi video încadrate în următoarele categorii:
• • documente cu acces liber (nu se află sub incidenţa dreptului de autor sau drepturile au fost negociate cu moştenitorii de drept);
• • documente aflate sub incidenţa dreptului de autor, disponibile exclusiv in situ şi fără drepturi de copiere, pe site fiind afişate doar metadatele, pictograma şi, selectiv, primele 5 pagini din document, pornind de la pagina de titlu.
Majoritatea documentelor sunt în limba română, dar se regăsesc documente cu texte integral sau parţial în limbile : slavonă, latină, greacă (veche, bizantină, neogreacă), armeană, română cu alfabet chirilic, română cu alfabet de tranziţie, maghiară, rusă, germană, franceză, italiană, arabă, poloneză, suedeză.
• documente în mod imagine
Sunt documentele digitizate în format TIFF şi publicate în format JPEG, JP200 sau PDF care prezintă, pagină cu pagină, în facsimil, imaginile fotografice ale originalului reproducându-l fidel.
• documente în mod text
Sunt documentele digitizate în format TIFF şi prezentate în format PDF oferind posibilitatea efectuării căutărilor în text şi copierea unor citate. Modul text este generat folosind o procedură automată numită Recunoașterea Optică a Caracterelor – OCR care foloseşte programe ce execută compararea automată a imaginilor digitizate cu dicţionarele de caractere implementate. Aceste programe prezintă limitări în funcţie de calitatea originalului, astfel încât caracterele de tipar prea groase sau prea subţiri, supraimprimarea tiparului, diacriticele, caracterele chirilice si greceşti, semnele speciale, schemele, tabelele, semnele şi petele de uzură devin obstacole în recunoaşterea optică şi introduc un factor de eroare în textul rezultat. Ca urmare, nivelul de calitate al textului obţinut poate varia de la un document la altul. Un OCR brut care oferă o rată de recunoaştere exactă a peste 60% din text este considerat acceptat de DACOROMANICA. Cu scopul limitării acestor erori şi pentru depăşirea pragului de 85% recunoaştere exactă, pentru cea mai mare parte din documentele publicate de DACOROMANICA, se folosesc programe speciale de corectare şi prelucrare a documentelor digitale.





