Import i eksport danych
Naszym cudownym archiwum cyfrowym ważna jest kwestia importowania i eksportowania danych. Oczywiście dokumenty do systemu nie pochodzą tylko z digitalizacji, ale mamy też dokumenty born digita ze źródeł obcych jak i własnych. Import tych dokumentów musi obejmować wszystkie dostępne na rynku formaty zamknięte jak i otwarte. W biznesie będziemy mieli takie dokumenty jak: dowody nadania, umowy z kontrahentami, rozliczenia podatkowe, deklaracje, wzory pism, ustawy, rozporządzenia, akty notarialne, korespondencja, wnioski urlopowe, podania i inne. Ważne jest aby po digitalizacji nasze dane można było odczytać i modyfikować w różnych (także zewnętrznych) systemach. Dlatego w imporcie jak i eksporcie musimy mieć możliwość dostęp do cyfrowych formatów m.in.:
- CSV
- XML
- pliki graficzne (jpg, png, tiff, bmp) pliki tekstowe (txt, doc, docs)
- pliki dźwiękowe (mp3, wav) pliki hybrydowe (PDF, PDF/A)
Indeksowanie
W archiwach najczęściej tworzy się indeksy osobowe, geograficzne, rzeczowe. W biznesie tych danych jest o wiele więcej. Przykładowo jedna firma może wyszukiwać faktury po dacie, druga firma będzie wyszukiwała po numerze faktury, inna firma wybierze inny element itd.. W zależności jakie nam są potrzebne dane to takie zczytujemy do systemu. Dlatego też warto tworzyć tzw. słowniki kontrolowane. Krótko mówiąc słownik jest listą terminów i wyrażeń, które mogą zostać użyte w celu tworzenia metadanych. Jeśli słownik, który używamy jest znany i rozwijany to może nam pomóc stworzenia bardziej zaawansowanych mechanizmów wyszukiwania. Ogólnie taki słownik pomaga poprawić wyniki wyszukiwania w systemie. Mamy kilka typów słowników kontrolowanych tj.: listy terminów, tezaurusy czy hasła przedmiotowe, hasła wzorcowe itp.. Te typy słowników różnią się one od siebie minimalnie. Jednak wszystkie służą do tworzenia (dobrych) metadanych.
Weryfikacja
Jeśli na którymś etapie zrobiliśmy błąd to w zasadzie musimy cofnąć się do początku tj. do zeskanowania ponownie dokumentu dlatego ważna jest weryfikacja na każdym etapie digitalizacji czy tworzenia cyfrowego archiwum. Gdy skanujemy dokument - weryfikacja, wprowadzanie metadanych - weryfikacja, OCR - weryfikacja... każdy etap jest ważny !!!. Dla oszczędności czasu niekiedy przyjmuje się że weryfikacji poddajemy 20-30 % zbioru. Jeśli mamy czas i zasoby ten procent musi być większy.
Brak komentarzy:
Prześlij komentarz