INFO: Musicie to sprawdzić konieczne :)
piątek, 30 października 2020
Felieton: Budowa cyfrowego archiwum
Mamy cztery główne fazy budowania Cyfrowego Archiwum (CA):
- projektowanie
- wdrożenie
- prawa autorskie
- rozwój
PROJEKTOWANIE
1. Jaka ma być forma cyfrowego archiwum
- jaki model CA
- jaki jest cel CA
- kto będzie tworzył CA
- jakie oprogramowanie
- jaki kosztorys
- opracowanie harmonogramu wdrożenia
2. Wybór oprogramowania
3. Kosztorys
- praca własna w ramach danej organizacji
- outsourcing
4. Harmonogram wdrożenia
- wybór oprogramowania
- instalacja oprogramowania
- dostosowanie aplikacji do potrzeb danej organizacji
- stworzenie procedur i polityki funkcjonowania
- promocja
- otwarcie
WDROŻENIE
1. Budowanie zasobu
2. Zarządzanie użytkownikami CA
- rejestracja użytkowników
- przypisanie użytkowników do odpowiednich grup
- nadanie odpowiednich uprawnień
- Zarządzanie procesem deponowania
PRAWA AUTORSKIE
- własność danej organizacji
- materiały obce
ROZWÓJ
czwartek, 29 października 2020
Praca: Specjalista ds. Rozwiązań Technicznych [Bielsko-Biała, ADP]
INFO: Do projektu digitalizacyjnego Paperless3.
środa, 28 października 2020
Artykuł: Nowe pomysły na zarządzanie dokumentami w organizacji
INFO: Ciekawy artykuł na temat wizji zarządzania dokumentami w organizacjach.
wtorek, 27 października 2020
Praca: Pracownik biurowy [Warszawa, Digital-Center Sp. z o.o.]
INFO: Poszukiwany pracownik do skanowania i metadanych.
Praca: Starszy Specjalista ds. EZD [Warszawa, Ministerstwo Finansów]
INFO: Poszukiwany doświadczony administrator EZD.
https://nabory.kprm.gov.pl/mazowieckie/warszawa/starszy-specjalista,70477,v7
Światowy Dzień Dziedzictwa Audiowizualnego
Dziś jest Światowy Dzień Dziedzictwa Audiowizualnego. To młode święto obchodzone po raz pierwszy w 2007 roku. Trzeba pamiętać jak bardzo ważna jest archiwizacja (ochrona) ważnych dokumentów, które ukazują ważne przemiany i wydarzenia :) W tym roku tematem Światowego Dnia Dziedzictwa Audiowizualnego jest "Your Window to the World".
https://en.unesco.org/commemorations/worldaudiovisualday
niedziela, 25 października 2020
Felieton: Określenie celów organizacji do wdrożenia systemu DMS
Musimy określić takie problemy jak:
- określenie celów wdrożenia (np. jakie są problemy, które system DMS ma rozwiązać
- określenie parametrów systemu DMS (np. jak duża jest dana organizacja, jak długo są przechowywane dokumenty)
- określenie struktury plików (np. jakie mają być rodzaje dokumentów, jakie mają być metadane, rodzaje informacji jakie muszą być przechowywane)
- określenie workflow/parametrów digitalizacji (np. jakie rodzaje dokumentacji będą skanowane, parametry techniczne plików)
- migracja/konwertowanie istniejących zasobu (np. jakie i ile dokumentów wymaga migracji/konwersji)
Szkolenie: Creative Operations and Everyday Workflows with Digital Asset Management
INFO: Jutro w Rutgers School of Communication and Information wystartuje miesięczny płatny kurs z zarządzaniazasobami cyfrowymi (DAM). To tylko 895$ ;(
piątek, 23 października 2020
Praca: DMS DEVELOPER [Wrocław]
INFO: Pisałem o DMS-ach a tu pojawiło się ogłoszenie na stanowisko DMS Developer :)
https://www.arche-consulting.pl/oferty-pracy/index/DMS-Developer-ELO,11723
czwartek, 22 października 2020
Felieton: Założenia idealnego systemu Document Management System
- obsługa całości dokumentacji organizacji (przez aplikacje, przez WWW, urządzenia mobilne)
- ochrona przed utratą danych w przypadku zgubienia lub zniszczenia dokumentu papierowego/cyfrowego (np. cyberbezpieczeństwo, certyfikaty SSL, ochrona danych osobowych)
- zarządzenie dokumentacją zgodną z normami ISO
- wydajny workflow digitalizacyjny (digitalizacja masowa, OCR)
- redukcja kosztów (np. niższe koszty składania i archiwizacji dokumentów)
- redukcja czasu (np. kontrola czasu, szybszy obieg dokumentów)
- praca grupowa i praca z dokumentami z dowolnego miejsca zna ziemi
- automatyzacja zadań/procesów
- tworzenie repozytorium cyfrowego (szybki dostęp, archiwizacja długoterminowa, tworzenie kopii zapasowych) oraz archiwacja danych zgodnie aktualnymi przepisami (JRWA)
- intuicyjny i personalizowany dostęp do dokumentów bieżących jak i archiwalnych
- pełna kontrola dokumentów i ich obiegu wewnątrz organizacji
- oparcie na rozwiązaniach chmurowych
- tworzenia własnych wzorów dokumentów i formularzy
- instalacja na wielu platformach systemowo-sprzętowych i integracja z innymi systemami IT
- analiza i kontrola realizacji procesów, raportowanie
- skalowalność (obsługa nawet ogromnej ilości dokumentów)
- ekologia
- przyspieszenie przepływu informacji/poprawa komunikacji między pracownikami
- użycie SI do procesów
- modyfikacja ogólnego workflow
Zasoby: Projekt digitalizacji hetyckich tabliczek z pismem klinowym
INFO: Akademia Nauk i Literatury w Moguncji, która w swoich zbiorach posiada 30 000 hetyckich tabliczek glinianych z pismem klinowym planuje je zdigitalizować, a następnie udostępnić wraz z opisami. Sama digitalizacja nie będzie trudna jednak bez opisu nie będzie miała wielkiej wartości i trzeba o tym zawsze pamiętać. ;)
Więcej informacji znajdziemy tutaj https://www.uni-mainz.de/presse/aktuell/12145_ENG_HTML.php
wtorek, 20 października 2020
Zasoby: MAPSTER - Mapy archiwalne Polski i Europy Środkowej
INFO: Fajne repozytorium materiałów kartograficznych w postaci cyfrowej, które są udostępniane do użytku niekomercyjnego.
Link tu: MAPSTER
Felieton: WSTĘP DO METADANYCH
Dzięki metadanym możemy uporządkować nasz informacyjny świat (prywatny i ten zawodowy). W digitalizacji (a także w archiwizacji), do której się odnoszę metadane pełnią kapitalną rolę. Bo tak naprawdę bez dobrych metadanych nie ma dobrej digitalizacji.
#Definicja
Krótko mówiąc metadane to dane o danych. Natomiast oficjalna definicja to:
„Metadane to ustrukturyzowane informacje opisujące, tłumaczące, lokalizujące i ułatwiające we wszelki inny sposób odnalezienie, wykorzystanie lub zarządzanie zasobem informacji. Metadane często określa się mianem „danych o danych” albo „informacji o informacjach”
National Information Standards Organization
http://www.niso.org/publications/press/UnderstandingMetadata.pdfNa naszym podwórku definicja metadanych została też określona w Rozporządzeniu MSWiA z dnia 30 X 2006 r. w sprawie niezbędnych elementów struktury dokumentów elektronicznych jako:
„zestaw logicznie powiązanych z dokumentem elektronicznym usystematyzowanych informacji opisujących ten dokument, ułatwiających jego wyszukiwanie, kontrolę, zrozumienie i długotrwałe przechowanie oraz zarządzanie”.
Rozporządzenie to powstało w oparciu o standard Dublin Core Metadata Initiative.
#Słownik terminów metadanych
http://skryba.inib.uj.edu.pl/~nahotko/metadane/slownik.htm#ods03
#Podział metadanych
Metadane można podzielić z grubsza na 3 rodzaje:
- administracyjne (informacje dotyczące lokalizacji, gromadzenia)
- prawa (twórców, autorskie, licencje, itd.)
- techniczne (formaty, kodeki, itd.)
- fizyczne (rodzaj nośnika, kolor, itd.)
- dotyczące przechowywania (stan zachowania, możliwość odtwarzania, warunki przechowywania)
- opisowe (narzędzia wyszukiwawcze, indeksy)
- strukturalne (relacje między obiektami i ich elementami)
Wszystkie te metadane muszą należycie charakteryzować dany dokument, tak aby każdy użytkownik mógł zrozumieć m.in. jego zawartość, źródło pochodzenia, warunki wykorzystania. Dodatkowo metadane obiektów cyfrowych mogą być dołączone do plików tj. metadane zewnętrzne lub stanowić część struktury plików tj. metadane wewnętrzne.
#Przykłady praktyczne metadanych m.in.:
- autor dokumentu
- całkowity czas edycji dokumentu
- czas ostatniej modyfikacji dokumentu
- rodzaj aparatu z którego zrobiono zdjęcie
- ustawienia aparatu
- adres IP komputera
# Standardy metadanych
- Dublin Core Metadata Element Set (DCMES)
https://www.dublincore.org/specifications/dublin-core/dces/
- ISAD(G) (ang. General International Standard Archival Description)
https://agad.gov.pl/?page_id=862
- ISAAR (CPF) (ang. International Standard Archival Authority Record for Corporate Bodies, Persons and Families)
- EAD (ang. Encoded Archival Description)
- MARC 21 (ang. MAchine-Readable Cataloging)
https://www.loc.gov/marc/umb/um01to06.html
- METS (ang. Metadata Encoding and Transmission Standard)
https://www.loc.gov/standards/mets/
#Zastosowanie i korzyści metadanych
Dzięki określonej postaci metadane powinny być czytelne zarówno dla komputerów jak i dla ludzi. Mogą (muszą) być przetwarzane maszynowo i wykorzystane do w takich rzeczy jak: indeksowanie, wyszukiwanie czy przetwarzanie automatyczne.
Dzięki metadanym przede wszystkim szybciej uzyskujemy informacje na temat zbiorów danych, dostępnych dla interesującego nas obszaru. Łatwiejsze jest też zarządzanie zasobami danych w obrębie danej instytucji/organizacji.
# Sposoby udostępniania metadanych
Tak naprawdę mamy dwa sposoby udostępniania metadanych. Pierwsze to XML (ang. Extensible Markup Language), a drugie to RDF (ang. Resource Description Framework).
Więcej o XML: https://www.w3schools.com/xml/default.asp
Więcej o RDF: https://www.w3schools.com/xml/xml_rdf.asp
#Co to jest XML/RDF
Generalnie dokumenty XML są plikami tekstowymi jako uproszczona część Standard Generalized Markup Language (SGML). Dokumenty XML służą do opisywanie danych, które potem są przechowywane. Wspomniany RDF natomiast opisuje zasoby sieci Web, ze składnią opartą na XML za pomocą wyrażenia składającego się z trzech elementów:
- podmiotu
- orzeczenia/predykatu (własność)
- dopełnienia/obiektu (wartość)
#Jak otworzyć plik XML?
Jak już wcześniej wspomniałem pliki XML są plikami tekstowymi, więc można otwierać lub edytować dowolnym edytorem tekstu np. notatnik, notepad++. Jest też sporo edytorów online.
#Zapis i struktura dokumentów XML
Na strukturę dokumentu XML składa przede wszystkim:
- prolog (w takim prologu umieszcza się zwykle deklaracje)
- elementy (podstawowa jednostka strukturalna dokumentu XML, wyróżniamy element główny i pozostałe elementy potomne)
- atrybuty (każdy znacznik może mieć nieskończoną liczbę atrybutów, które precyzują informacje zawarte w elementach)
- komentarze (pozwalają na dodanie uwag tylko w czasie edycji dokumentu)
- encje tekstowe (rodzaju szablonów tekstu, w tym miejscu możemy umieścić niedozwolone znaki)
#Przykład dokumentu XML do obiektu cyfrowego w serwisie Polona:
<?xml version="1.0" encoding="UTF-8"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://polona.pl/item/31999432/">
<title xml:lang="pl">Jak żyć z ludźmi? : popularny wykład zwyczajów towarzyskich.</title>
<alternative xml:lang="pl">Katechizm życia.</alternative>
<date xml:lang="pl">[1898]</date>
<dateSys xml:lang="pl">1898-01-01</dateSys>
<language xml:lang="pl">pol</language>
<country xml:lang="pl">pl </country>
<imprint xml:lang="pl">Warszawa : Księgarnia Warszawska, [1898] ([Warszawa] : Tow. Kom. St. Zaleski).</imprint>
<type xml:lang="pl">poradniki</type>
<subject xml:lang="pl">Savoir-vivre DBN</subject>
<signature xml:lang="pl">I 1.576.616</signature>
<rights xml:lang="pl">Domena Publiczna. Wolno zwielokrotniać, zmieniać i rozpowszechniać oraz wykonywać utwór, nawet w celach komercyjnych, bez konieczności pytania o zgodę. Wykorzystując utwór należy pamiętać o poszanowaniu autorskich praw osobistych Twórcy.</rights>
<recordNo xml:lang="pl">b0000001638990</recordNo>
<edition xml:lang="pl">Wyd. 3.</edition>
<physicalDescription xml:lang="pl">77, III s. ; 14 cm</physicalDescription>
<literatura xml:lang="pl">Estr XIX t. 2 s. 166</literatura>
<tags xml:lang="pl">Savoir-vivre</tags>
<digitalCopy xml:lang="pl">Zakład Reprografii i Digitalizacji Biblioteki Narodowej</digitalCopy>
<accessibility xml:lang="pl">dostęp publiczny</accessibility>
<source xml:lang="pl">Biblioteka Narodowa</source>
</rdf:Description>
</rdf:RDF>
#Zarządzanie metadanymi
Aby nimi dobrze zarządzać musimy spełnić kilka warunków tzn. metadane muszą być:
- dostępne (muszą być przechowywane w dostępnym miejscu)
- dobrej jakości (muszą być kompletne, precyzyjne i czytelne)
- trwałe (muszą być przechowywane przez określony czas ponieważ życie metadanych jest dłuższe od życia samych danych. Metadane często powstają przed zebraniem samych danych, później te metadane muszą być przechowywane po usunięciu danych)
#Cykl życia metadanych
- tworzenie
- zarządzanie
- aktualizacja
- przechowywanie
- publikacja
- usuwanie
#Jakość metadanych w 9 krokach
- precyzyjne metadane (czy nasz zasób informacyjny został dobrze opisany)
- dostępność metadanych (czy mamy dostęp do metadanych w tej chwili, czy będziemy mieli dostęp do nich w przyszłości)
- kompletność metadanych (czy zawarte zostały wszystkie istotne cechy zasobu informacyjnego)
- zgodności metadanych z przyjętymi standardami
- spójność metadanych (czy dane nie są sprzeczne ze sobą)
- wiarygodność i pochodzenie metadanych (czy pochodzą z wiarygodnych źródeł)
- czytelności metadanych (czy nadają się do odczytu, czy nie są uszkodzone, jak są udostępniane metadane)
- istotność metadanych (czy zawierają dostateczne informacje do realizacji aktualnego zadania)
- aktualność metadanych (czy odpowiadają bieżącym właściwościom zasobu informacyjnego)
#Słowniki kontrolowane
Słownik kontrolowany to ustalona lista słów i zwrotów, które mogą zostać użyte w celu tworzenia metadanych.
#Mapowanie metadanych
Jest to po prostu tłumaczenie metadanych z jednego formatu na inny format metadanych.
Jak już wspomniałem wszyscy zbierają metadane. Należy pamiętać, że same nie dają jeszcze dostępu do danych, do których odnoszą się te metadane. Jednak pozwalają na znalezienie dostępu do źródeł bezpośrednich. Dana organizacja/instytucja/osoba fizyczna sama musi określić czy dostęp do metadanych ma być łatwy czy utrudniony. Przykładowo Facebook wyczyszcza metadane zdjęć (EXIF), które publikujemy. W serwisie Polona mamy swobodny dostęp tj. możemy ściągnąć obiekt cyfrowy (w postaci plików JPG/PDF) oraz możemy ściągnąć pliki XML dotyczące tych obiektów.
#Zarządzanie archiwum – wybór metadanych
Jeśli chodzi o archiwizację to każda instytucja ma swoją specyfikę, która powinna uwzględniać także wybór odpowiednich metadanych np.:
- jakie mamy rodzaje obiektów zgromadzonych w archiwum
- jakie są cele digitalizacji (rozpatrywanie czy obiekty mają być tylko archiwizowane czy mają też być udostępniane w sieci)
- wybór sposobu przechowywania metadanych
Dobre wewnętrzne standardy metadanych mają kluczowe znaczenie dla długoterminowej archiwizacji. Jak już na początku wspomniałem metadane są ważne. Ułatwiają mam przede wszystkim zarządzanie dokumentami. Trzeba o tym pamiętać. Powyższy tekst to tylko wstęp/wybór ważniejszych informacji.
piątek, 16 października 2020
Zasoby: Traktaty rdzennych Amerykanów dostępne online
INFO: Zeskanowano traktaty dotyczące rdzennych Amerykanów. Są bezpłatnie dostępne w Internecie za pośrednictwem National Archives Catalog. Ponadto, we współpracy z The Museum of Indian Arts and Culture. Traktaty z dodatkowymi informacjami są dostępne za pośrednictwem DigiTreaties.
Zasoby: Repozytorium Janusza Korczaka
INFO: Mamy do dyspozycji nowe archiwum cyfrowe dotyczące Janusza Korczaka. Możemy przeglądać zdjęcia, dokumenty, odnośniki do innych zewnętrznych zbiorów.
http://korczak.ckc.uw.edu.pl/?fbclid=IwAR2JVMKwErX3nuIbgMdETCIL2tRyLDjBLf5XsFKSJKfdu1UbAJHKipLo1Ww
wtorek, 13 października 2020
Zasoby: Otwarty dostęp do zasobów naukowych Uniwersytetu Wrocławskiego: Leopoldina
INFO: Zapraszam się do zapoznania się z biblioteka cyfrową Uniwersytetu Wrocławskiego. Naprawdę Warto !!!
Konferencja online: Digital libraries and Internet Giants
22 października odbędzie się konferencja online pt. Competitors, Comparators, Complements? Digital libraries and Internet Giants.
Rejestracja na stronie wydarzenia FB https://www.facebook.com/events/2612700322326952
Linked Jazz
Linked Jazz jest ciekawym projektem wizualizującym powiązania między muzykami jazzowymi (oparte na otwartych danych powiązanych - Linked Open Data).
Narzędzie: Omeka S v3.0.0 wydana
środa, 7 października 2020
wtorek, 6 października 2020
Pierwsze wydanie Don Kichota autorstwa Miguela de Cervantes z 1605 r.
Pierwsze wydanie Don Kichota autorstwa Miguela de Cervantes z 1605 r.
Internet Archive razem z Cloudflare
Internet Archive nawiązało współpracę z Cloudflare która zajmuje się infrastrukturą internetową i bezpieczeństwem. Celem tej współpracy jest automatyzacja archiwizowania stron www korzystających z usługi Cloudflare Always Online. Więcej możemy przeczytać tu:
https://www.inputmag.com/culture/wayback-machine-cloudshare-team-up-to-archive-the-internet
niedziela, 4 października 2020
czwartek, 1 października 2020
Rhenus Data Office Polska poszukuje pracowników
Rhenus Data Office poszukuje:
Junior Sales Manager ➡️ https://www.rhenus-data.pl/pl/o-nas/oferty-pracy/specjalista-ds-sprzedazy/
Business Development Manager ➡️ https://www.rhenus-data.pl/pl/o-nas/oferty-pracy/business-development-manager/
Zasoby: Cyfrowe archiwum drzeworytów japońskich
INFO: Na stronie ukiyo-e.org możemy przeglądać, wyszukiwać, pobierać i drukować skany drzeworytów japońskich. W bazie jest ponad 220 000 odbitek.
Raidió Teilifís Éireann digitalizuje
Raidió Teilifís Éireann (irlandzkie publiczne radio i telewizja) planuje wydać ponad 3 miliony euro na digitalizację setek tysięcy nagrań wideo i audio z 1950 roku „w trybie pilnym”. Zbiór nagrań obejmuje 300 000 godzin i 235 000 taśm programów telewizyjnych od 1985 r. W formacie Betacam SP; 65 000 ćwierćcalowych taśm audio od 1950 do 2003 roku; oraz 110 000 płyt z komercyjnej biblioteki muzycznej.

Jak stworzyłem kalkulator skanowania w Excelu – krok po kroku
W ramach testu poprosiłem ChatGPT o3 mini-high o stworzenie kalkulatora do obliczania rozdzielczości skanów. Prompt był następujący: stwór...
-
INFO: Coś się wreszcie ruszyło odnośne archiwizacji Internetu. :) Prelekcje będą w pierwszym dniu. W drugim dniu będą panele dyskusyjne tj....
-
INFO: W dniach 24-26/11/2021 odbędzie się w Toruniu ogólnopolska konferencja dla osób odpowiedzialnych za obieg informacji, kompletowanie a...
-
INFO: Pięć znaków ostrzegawczych, które mówią nam, że potrzebujemy systemu DAM :) https://www.widen.com/blog/five-telltale-signs-that-you-ne...