czwartek, 20 maja 2021

Felieton: Digitalizacja: Eksport i weryfikacja danych w Archiwum

Import i eksport danych

Naszym cudownym archiwum cyfrowym ważna jest kwestia importowania i eksportowania danych. Oczywiście dokumenty do systemu nie pochodzą tylko z digitalizacji, ale mamy też dokumenty born digita ze źródeł obcych jak i własnych. Import tych dokumentów musi obejmować wszystkie dostępne na rynku formaty zamknięte jak i otwarte. W biznesie będziemy mieli takie dokumenty jak: dowody nadania, umowy z kontrahentami, rozliczenia podatkowe, deklaracje, wzory pism, ustawy, rozporządzenia, akty notarialne, korespondencja, wnioski urlopowe, podania i inne. Ważne jest aby po digitalizacji nasze dane można było odczytać  i  modyfikować  w  różnych  (także  zewnętrznych)  systemach.  Dlatego  w  imporcie jak  i  eksporcie  musimy  mieć  możliwość  dostęp  do  cyfrowych  formatów  m.in.:

  • CSV 
  • XML
  • pliki graficzne (jpg, png, tiff, bmp) pliki tekstowe (txt, doc, docs)
  • pliki dźwiękowe (mp3, wav) pliki hybrydowe (PDF, PDF/A)

Indeksowanie

W archiwach najczęściej tworzy się  indeksy  osobowe,  geograficzne,  rzeczowe.  W  biznesie  tych  danych jest o wiele więcej. Przykładowo jedna firma może wyszukiwać faktury po dacie, druga firma będzie wyszukiwała po numerze faktury, inna firma wybierze inny element itd.. W zależności jakie nam są potrzebne dane to takie zczytujemy do systemu. Dlatego też  warto  tworzyć  tzw.  słowniki kontrolowane. Krótko mówiąc słownik jest listą terminów i wyrażeń, które mogą zostać użyte w celu tworzenia metadanych. Jeśli słownik, który używamy jest znany i rozwijany to może nam pomóc  stworzenia  bardziej  zaawansowanych  mechanizmów   wyszukiwania.   Ogólnie   taki   słownik pomaga poprawić wyniki wyszukiwania w systemie. Mamy kilka typów  słowników  kontrolowanych  tj.: listy terminów, tezaurusy czy hasła przedmiotowe, hasła wzorcowe itp.. Te typy słowników różnią się one od siebie minimalnie. Jednak wszystkie służą do tworzenia (dobrych) metadanych.

Weryfikacja

Jeśli na którymś etapie zrobiliśmy błąd to w zasadzie musimy cofnąć się do początku tj. do zeskanowania ponownie dokumentu dlatego ważna jest weryfikacja na każdym etapie digitalizacji czy tworzenia cyfrowego archiwum. Gdy skanujemy dokument - weryfikacja, wprowadzanie metadanych - weryfikacja, OCR  -  weryfikacja...  każdy  etap jest ważny !!!. Dla oszczędności czasu niekiedy przyjmuje się że weryfikacji poddajemy 20-30 % zbioru. Jeśli mamy czas i zasoby ten procent musi być większy.

Brak komentarzy:

Prześlij komentarz

Prompty dla Archiwisty cz.1

Czas na nową serię „Prompty dla Archiwisty” , w której podzielę się pomysłami na wykorzystanie promptów w pracy archiwalnej. Znajdziesz tu z...