środa, 20 listopada 2024

Prompty dla Archiwisty cz.1: Zarządzanie Innowacjami

Czas na nową serię „Prompty dla Archiwisty”, w której podzielę się pomysłami na wykorzystanie promptów w pracy archiwalnej. Znajdziesz tu zarówno te, które sam opracowałem, jak i te wyszukane w odmętach Internetu. Wszystko po to, by ułatwić pracę archiwalną. Będzie prosto i konkretnie. Zapraszam!

Prompt: Zarządzanie Innowacjami

Wygeneruj kompleksowy plan zarządzania innowacjami w organizacji [rodzaj działalności lub branża], koncentrując się na [konkretnych celach lub wyzwaniach związanych z innowacjami] i biorąc pod uwagę [docelową grupę odbiorców lub kluczowych interesariuszy]. 

Rodzaj działalności/branża: [Wstaw tutaj] 

Cele/wyzwania innowacyjne: [Wstaw tutaj] 

Docelowi odbiorcy/interesariusze: [Wstaw tutaj]

Branża, jak łatwo się domyślić, to archiwistyka, a za główny cel obrałem zastosowanie technologii OCR (Optical Character Recognition). Dlaczego właśnie to? OCR pozwala na przekształcenie fizycznych dokumentów i obrazów w cyfrowe, wyszukiwalne treści, co znacząco ułatwia dostęp do zasobów archiwalnych.

Jeśli chodzi o docelowych odbiorców, skupiłem się na twórcach kultury i mediów: dziennikarzach, filmowcach, pisarzach oraz artystach. To właśnie oni najczęściej poszukują materiałów i inspiracji ukrytych w archiwach, a OCR może stać się dla nich kluczem do szybszego i bardziej efektywnego odkrywania tych zasobów. Dzięki temu archiwa mogą stać się bardziej otwarte i przyjazne dla współczesnych użytkowników.

A oto nasz ejaj (ChatGPT 4o) stworzył. Oczywiście zawsze pamiętamy o potrzebie weryfikacji takiej odpowiedzi. 

Plan Zarządzania Innowacjami w Branży Archiwistycznej

1. Wstęp

Wprowadzenie technologii OCR (Optical Character Recognition) do archiwów jest kluczowym krokiem w kierunku cyfryzacji i zwiększenia dostępności zasobów dla twórców kultury i mediów, takich jak dziennikarze, filmowcy, pisarze oraz artyści. Ten plan koncentruje się na skutecznej implementacji OCR, uwzględniając potrzeby tych grup oraz wyzwania technologiczne.


2. Cele Zarządzania Innowacjami

  1. Zwiększenie dostępności zasobów archiwalnych:

    • Przekształcenie dokumentów w cyfrowe i wyszukiwalne treści.
    • Ułatwienie twórcom kultury szybkiego dostępu do potrzebnych materiałów.
  2. Poprawa jakości danych:

    • Minimalizacja błędów w rozpoznawaniu tekstu i zapewnienie wysokiej dokładności technologii OCR.
  3. Dostosowanie narzędzi do potrzeb twórców:

    • Umożliwienie intuicyjnego wyszukiwania i analizowania danych.
  4. Promocja archiwów jako źródła inspiracji:

    • Zwiększenie świadomości o wartości archiwów w procesach twórczych.

3. Etapy Zarządzania Innowacjami

Etap 1: Diagnoza i Analiza Potrzeb

  • Identyfikacja potrzeb twórców kultury:
    • Przeprowadzenie wywiadów i ankiet wśród dziennikarzy, pisarzy, filmowców oraz artystów.
    • Zrozumienie, jakie typy materiałów są najbardziej pożądane (np. fotografie, dokumenty tekstowe, mapy).
  • Analiza zasobów archiwalnych:
    • Ocena jakości i formatu istniejących materiałów.
    • Weryfikacja, które zasoby są priorytetowe do digitalizacji.

Etap 2: Dobór Technologii i Partnerów

  • Wybór technologii OCR:

    • Testowanie dostępnych rozwiązań (np. ABBYY, Tesseract, Google Vision).
    • Wybór narzędzi, które najlepiej rozpoznają historyczne i nietypowe czcionki.
  • Współpraca z ekspertami:

    • Nawiązanie współpracy z firmami technologicznymi i instytucjami naukowymi.
    • Zaangażowanie specjalistów ds. digitalizacji i historyków.

Etap 3: Implementacja

  • Digitalizacja zasobów:

    • Utworzenie zespołu ds. digitalizacji dokumentów.
    • Stworzenie procedur skanowania i obróbki danych.
  • Trening algorytmów OCR:

    • Dostosowanie technologii do specyficznych materiałów (np. stare druki, dokumenty zniszczone).
  • Tworzenie platformy dostępu:

    • Budowa portalu, który umożliwia wyszukiwanie treści przez frazy kluczowe, kontekst i metadane.

Etap 4: Promocja i Edukacja

  • Promowanie zasobów archiwalnych:

    • Organizowanie warsztatów dla twórców kultury o korzystaniu z narzędzi OCR.
    • Kampanie informacyjne prezentujące potencjał archiwów jako źródła inspiracji.
  • Szkolenie personelu:

    • Wdrażanie szkoleń z obsługi narzędzi OCR i zarządzania cyfrowymi zasobami.

Etap 5: Monitorowanie i Doskonalenie

  • Ewaluacja efektów:

    • Zbieranie informacji zwrotnych od użytkowników.
    • Ocena jakości i przydatności udostępnionych danych.
  • Aktualizacja technologii:

    • Ciągłe doskonalenie algorytmów OCR w odpowiedzi na nowe wyzwania i potrzeby.

4. Kluczowi Interesariusze

  1. Twórcy kultury i mediów:

    • Korzystają z zasobów archiwalnych jako materiałów źródłowych i inspiracyjnych.
  2. Firmy technologiczne:

    • Dostarczają narzędzia i wsparcie techniczne dla implementacji OCR.
  3. Pracownicy archiwów:

    • Odpowiedzialni za proces digitalizacji i zarządzanie zasobami.
  4. Instytucje edukacyjne i naukowe:

    • Współpracują przy rozwoju technologii i promocji archiwów.

5. Mierniki Sukcesu

  • Liczba zdigitalizowanych i udostępnionych dokumentów.
  • Procent poprawności rozpoznawania tekstu przez OCR.
  • Liczba użytkowników platformy i częstotliwość korzystania z zasobów.
  • Liczba nowych projektów twórczych powstałych z wykorzystaniem zasobów archiwalnych.

6. Potencjalne Ryzyka

  • Niedoszacowanie kosztów:

    • Konieczność pozyskania dodatkowego finansowania.
  • Problemy z ochroną praw autorskich:

    • Weryfikacja, które materiały mogą być legalnie udostępniane.
  • Ograniczona adaptacja przez użytkowników:

    • Brak wystarczającego szkolenia lub promocji może ograniczyć zainteresowanie.

7. Harmonogram

EtapCzas trwaniaDziałania
Diagnoza i analiza3 miesiąceAnkiety, analiza zasobów.
Dobór technologii2 miesiąceTestowanie i wybór technologii.
Implementacja6-12 miesięcyDigitalizacja, wdrożenie OCR.
Promocja i edukacja6 miesięcy (równolegle)Warsztaty, kampanie promocyjne.
Monitorowanie i ewaluacjaStały procesZbieranie opinii i doskonalenie.

Podsumowanie

Wdrożenie technologii OCR w archiwach skierowanych na potrzeby twórców kultury i mediów pozwoli zwiększyć dostępność i przydatność zasobów. Kluczem do sukcesu będzie współpraca z partnerami technologicznymi, edukacja odbiorców oraz stała analiza efektów i potrzeb użytkowników.

Odpowiedź jest dość precyzyjna i stanowi solidną bazę. Osoba posiadająca wiedzę i doświadczenie w tym zakresie może szybko ją zmodyfikować, dostosować do swoich potrzeb, a następnie efektywnie wykorzystać. 


wtorek, 12 listopada 2024

Projekt cyfrowego archiwum z AI? cz.3

Dwa testy już za mną – jeden zakończył się sukcesem, drugi niestety nie. Teraz czas na trzecią próbę: test Gemini od Google. Pytanie pozostaje takie samo jak poprzednio. Oto wynik: 

Rozbudowa projektu cyfrowego archiwum dziedzictwa kulturowego

Świetny początek! Przedstawiony przez Ciebie projekt stanowi solidną podstawę do stworzenia efektywnego cyfrowego archiwum. Chciałbym go rozbudować, uwzględniając dodatkowe aspekty, które mogą znacząco zwiększyć wartość i użyteczność takiego przedsięwzięcia.

1. Szczegółowa analiza potrzeb użytkowników

  • Kto będzie korzystał z archiwum? Naukowcy, studenci, mieszkańcy regionu, turyści?
  • Jakie informacje będą dla nich najważniejsze? Fakty historyczne, kontekst kulturowy, biografie twórców?
  • W jaki sposób chcą oni przeglądać materiały? Liniowo, tematycznie, poprzez interaktywne mapy?

Na podstawie tych informacji można dostosować interfejs użytkownika, funkcje wyszukiwania i sposób prezentacji materiałów.

2. Zaawansowane funkcje wyszukiwania

  • Wyszukiwanie pełnotekstowe: Umożliwi szybkie znajdowanie informacji w opisach, tytułach i nawet w treści zdigitalizowanych dokumentów.
  • Filtry: Pozwolą na precyzyjne zawężanie wyników wyszukiwania (np. data, autor, typ materiału).
  • Sugestie: Będą podpowiadały użytkownikom podobne materiały lub uzupełniające informacje.

3. Prezentacja materiałów

  • Wysoka jakość: Obrazy powinny być wyraźne i o wysokiej rozdzielczości.
  • Różnorodność formatów: Teksty, audio, wideo, 3D.
  • Interaktywność: Możliwość powiększania, obracania, słuchania, oglądania w różnych prędkościach.
  • Kontekst: Prezentacja materiałów w szerszym kontekście historycznym i kulturowym.

4. Ochrona danych i trwałość

  • Bezpieczeństwo: Silne hasła, regularne aktualizacje oprogramowania, kopie zapasowe.
  • Zgodność ze standardami: Przestrzeganie międzynarodowych standardów dotyczących archiwizacji cyfrowej (np. OAIS).
  • Trwałość nośników: Wybór trwałych nośników danych i regularna migracja danych.

5. Współpraca z innymi instytucjami

  • Udostępnianie danych: Współpraca z innymi instytucjami w celu tworzenia większych, bardziej kompleksowych zbiorów.
  • Standaryzacja metadanych: Używanie wspólnych standardów metadanych, co ułatwi integrację danych.
  • Projekty badawcze: Wspólne realizowanie projektów badawczych, wykorzystujących zasoby archiwum.

6. Edukacja i outreach

  • Programy edukacyjne: Warsztaty, lekcje, wykłady dla różnych grup wiekowych.
  • Publikacje: Artykuły naukowe, blog, newsletter.
  • Wystawy wirtualne: Interaktywne wystawy prezentujące wybrane zbiory.

7. Finansowanie i utrzymanie

  • Źródła finansowania: Granty, dotacje, sponsorzy, crowdfunding.
  • Model biznesowy: Możliwość wprowadzenia opłat za dostęp do niektórych zasobów lub usług.
  • Zespół: Kwalifikowany zespół pracowników odpowiedzialnych za zarządzanie archiwum.

Dodatkowe aspekty:

  • Sztuczna inteligencja: Wykorzystanie AI do automatycznego rozpoznawania obiektów na zdjęciach, transkrypcji nagrań audio, czy tłumaczenia tekstów.
  • Wirtualna rzeczywistość: Tworzenie wirtualnych rekonstrukcji historycznych miejsc i obiektów.
  • Otwarte dane: Udostępnianie danych w otwartym formacie, aby umożliwić ich dalsze wykorzystanie i analizę.

Przykładowy schemat projektu:

  1. Analiza potrzeb
  2. Zbieranie i digitalizacja materiałów
  3. Tworzenie metadanych
  4. Projektowanie bazy danych
  5. Tworzenie interfejsu użytkownika
  6. Implementacja systemu
  7. Promocja i edukacja
  8. Utrzymanie i rozwój

Chętnie rozwinę któryś z tych punktów lub odpowiem na dodatkowe pytania.

Jakie aspekty projektu chciałbyś zgłębić bardziej szczegółowo?

Możemy również omówić konkretne narzędzia i technologie, które mogą być przydatne w realizacji takiego projektu.

Z tej odpowiedzi jestem zadowolony. Jest krótsza i bardziej ogólna od odpowiedzi ChatGPT. Dodatkowo, Gemini stworzył trzy pomocnicze pytania, które można wykorzystać w dalszej pracy. Zadałem następujące zapytanie:

Rozwiń wszystkie punkty naciskiem na pkt 1-4. Zaproponuj  również konkretne narzędzia i technologie, które mogą być przydatne w realizacji takiego projektu.

Oto, co otrzymałem:

Rozwinięcie projektu cyfrowego archiwum dziedzictwa kulturowego z naciskiem na punkty 1-4 oraz propozycjami narzędzi i technologii

1. Szczegółowa analiza potrzeb użytkowników

Zrozumienie użytkownika jest kluczowe dla sukcesu projektu. Należy przeprowadzić badania jakościowe i ilościowe, aby określić:

  • Profil użytkownika: Wiek, wykształcenie, zainteresowania, częstotliwość korzystania z zasobów cyfrowych.
  • Cele użytkownika: Co użytkownik chce znaleźć w archiwum? Jakie informacje są dla niego najważniejsze?
  • Doświadczenie użytkownika: Jakie są oczekiwania użytkownika co do interfejsu, funkcjonalności, estetyki?

Narzędzia:

  • Ankiety online: Google Forms, SurveyMonkey
  • Wywiady: indywidualne, grupowe
  • Testy użyteczności: prototypy, analizy behawioralne

Przykładowe pytania badawcze:

  • Jakie informacje o [obiekt kultury] chciałbyś znaleźć w naszym archiwum?
  • Jakie funkcje ułatwiłyby Ci korzystanie z archiwum (np. wyszukiwanie, filtrowanie, porównywanie)?
  • Jak często korzystasz z zasobów cyfrowych tego typu?

2. Zaplanuj proces digitalizacji

Proces digitalizacji wymaga starannego przygotowania. Należy określić:

  • Rodzaj materiałów: Fotografie, dokumenty, nagrania audiowizualne, artefakty.
  • Stan zachowania: Ocena stanu fizycznego materiałów przed digitalizacją.
  • Metody digitalizacji: Skanowanie, fotografowanie, nagrywanie.
  • Rozdzielczość i format plików: Wybór odpowiednich parametrów w zależności od rodzaju materiału i sposobu wykorzystania.
  • Metadane: Określenie minimalnego zbioru metadanych (np. tytuł, autor, data, opis) oraz sposobu ich kodowania.

Narzędzia:

  • Skanery: płaskie, książkowe, wielkoformatowe
  • Aparaty fotograficzne: cyfrowe lustrzanki, bezlusterkowce
  • Oprogramowanie do edycji obrazu: Adobe Photoshop, GIMP
  • Oprogramowanie do zarządzania metadanymi: Omeka, CollectiveAccess

3. Zaplanuj strukturę archiwum

Struktura archiwum powinna być logiczna i intuicyjna dla użytkownika. Można zastosować różne metody:

  • Hierarchiczna: Podział zbiorów na coraz mniejsze jednostki (np. kolekcje, serie, dokumenty).
  • Tematyczna: Grupuje materiały według tematu (np. historia, sztuka, kultura).
  • Chronologiczna: Uporządkowanie materiałów według daty.
  • Kombinowana: Połączenie różnych metod.

Narzędzia:

  • Oprogramowanie do zarządzania treścią (CMS): WordPress, Drupal
  • Repozytoria cyfrowe: DSpace, Fedora

4. Opracuj system zarządzania metadanymi

Metadane są kluczowe dla wyszukiwania i opisu materiałów. Należy:

  • Zdefiniować schemat metadanych: Wybór standardowego schematu (np. Dublin Core) lub stworzenie własnego.
  • Automatyzacja: Zastosowanie narzędzi do automatycznego wyodrębniania metadanych (OCR, rozpoznawanie twarzy).
  • Wielojęzyczność: Tłumaczenie metadanych na różne języki.

Narzędzia:

  • Edytory metadanych: Excel, Google Sheets
  • Oprogramowanie do zarządzania metadanymi: Omeka, CollectiveAccess

Dodatkowe narzędzia i technologie

  • Chmury obliczeniowe: Amazon Web Services, Google Cloud Platform
  • Kontenery: Docker
  • Sieci neuronowe: rozpoznawanie obrazu, przetwarzanie języka naturalnego
  • Wirtualna i rozszerzona rzeczywistość: prezentacja obiektów 3D, interaktywne wystawy

Przykładowy proces digitalizacji i zarządzania archiwum:

  1. Ocena stanu materiałów: Sprawdzenie stanu fizycznego, wybór materiałów do digitalizacji.
  2. Przygotowanie materiałów: Czyszczenie, konserwacja.
  3. Digitalizacja: Skanowanie, fotografowanie, nagrywanie.
  4. Przetwarzanie: Obróbka obrazu, konwersja formatów.
  5. Tworzenie metadanych: Opis każdego obiektu.
  6. Wgrywanie do repozytorium: Przeniesienie zdigitalizowanych materiałów do systemu zarządzania archiwum.
  7. Udostępnienie: Publikacja w Internecie.

Pamiętaj, że wybór narzędzi i technologii powinien być dostosowany do specyfiki zbiorów, budżetu i zasobów instytucji.

Chcesz skupić się na którymś z tych punktów bardziej szczegółowo? Możemy omówić kwestie takie jak:

  • Wybór odpowiedniego oprogramowania do zarządzania archiwum
  • Implementacja systemów zabezpieczeń danych
  • Tworzenie interaktywnych prezentacji materiałów
  • Promocja archiwum w mediach społecznościowych

Proszę dać znać, jakie aspekty projektu chciałbyś jeszcze rozwinąć.

Otrzymałem szczegółowo opracowaną odpowiedź, zawierającą wiele przydatnych elementów. Dużym atutem są konkretne propozycje narzędzi, schematów metadanych oraz precyzyjny opis procesu digitalizacji. Całość została opracowana w sposób przejrzysty i logicznie uporządkowany, co znacząco ułatwia zrozumienie i wdrożenie proponowanych rozwiązań. Test zakończył się sukcesem – AI prowadzi 2-1.

środa, 6 listopada 2024

Projekt cyfrowego archiwum z AI? cz.2

ChatGPT nieźle sobie poradził z tworzeniem projektu cyfrowego archiwum. Teraz przyjrzę się programowi LM Studio, czyli lokalnej AI. To ciekawa alternatywa, szczególnie pod względem ochrony danych osobowych. Dzięki instalacji modelu AI na swoim komputerze, mamy pełną kontrolę nad przetwarzanymi informacjami. Proces instalacji jest szybki i sprawny, ale warto wiedzieć, że wydajność tego typu rozwiązań zależy od naszego sprzętu.

LM Studio zawiera wgrany model Llama-3.2-1B-Instruct-Q8-GGUF, ale możemy wgrać różne inne modele. Ze względu na ograniczenia sprzętowe postanowiłem przetestować jedynie ten wymieniony. Zapytanie, jakie zadałem AI, było takie samo jak przy poprzednim teście. Wynik jednak mnie zaskoczył, ale niestety w sposób negatywny.

Projekt cyfrowego archiwum dziedzictwa kulturowego dla instytucji kulturalnej

Dziedzictwo kulturowe:

  • Fotografie

  • Dokumenty (aktualizacja i konwersja do formatu cyfrowego)

  • Mapy historyczne regionu

  • Książki, czasopisma i rękopisy

Digitalizacja:

  • Skanowanie fotografii i dokumentów

  • Konwersja map do formatu cyfrowego

Struktura archiwum:

  • Katalogi tematyczne (np. Historia miasta, Architektura, Kultura)

  • Hierarchiczna struktura katalogów i podkatalogów

System metadanych:

  • Definicja pól metadanych (tytuł, autor, data, opis, słowa kluczowe)

Dostęp do archiwum:

  • Strona internetowa z możliwością wyszukiwania po tytule, autorze, dacie i słowach kluczowych

Promocja:

  • Promocja w mediach społecznościowych (Facebook, Instagram, Twitter)

  • Współpraca z lokalnymi portalami informacyjnymi

Aspekty prawne i etyczne:

  • Ochrona praw autorskich i prywatności osób uwiecznionych w materiałach

  • Ustalenie polityki bezpieczeństwa i dostępu do archiwum

Opis raportu: Projekt cyfrowego archiwum dziedzictwa kulturowego dla instytucji kulturalnej zakłada kompleksową digitalizację materiałów historycznych oraz ich udostępnienie szerokiemu gronu odbiorców. Raport opisuje procesy digitalizacji, strukturę archiwum, system dostępu do zasobów, a także aspekty prawne i etyczne związane z projektem. Całość planowana jest jako wydanie książkowe, które będzie pełnić funkcję kompleksowego przewodnika po tworzeniu i zarządzaniu cyfrowym archiwum dziedzictwa kulturowego.

Model nie był w stanie stworzyć żadnego sensownego projektu. Wypluł tekst, który był chaotyczny, bez struktury i powtarzał "Opis raportu" wielokrotnie. W efekcie, choć LM Studio może być dobrym rozwiązaniem do mniej wymagających zadań, w kontekście tworzenia złożonych projektów cyfrowych archiwów nadal wypada znacznie słabiej w porównaniu z bardziej rozbudowanymi modelami, które działają w chmurze.

Jak stworzyłem kalkulator skanowania w Excelu – krok po kroku

W ramach testu poprosiłem ChatGPT o3 mini-high o stworzenie kalkulatora  do obliczania rozdzielczości skanów. Prompt był następujący: stwór...