niedziela, 8 listopada 2020

Felieton: Protokoły Bittorrent w bibliotekach cyfrowych

Ostatnio przeglądając biblioteki cyfrowe zainteresowałem się tematem sposobu ściągania plików. Mamy dwie kwestie w tej materii tj. format plików oraz sposób pobierania. Przy formacie plików dużych dylematów nie ma. Do wyboru mamy wiele popularnych formatów tekstowych jak i graficznych. Mamy do dyspozycji: JPG, TIFF, PDF w różnych rozdzielczościach, a nawet takie formaty jak EPUB czy MOBI. W naszych bibliotekach cyfrowych jeszcze króluje format DjVu. W przypadku plików prezentowanych w plikach graficznych można ściągnąć wybraną przez nas część materiału lub całość.

Sposób udostępniania plików jest najczęściej bardzo prosty. Najczęściej pliki znajdują się na serwerze i na stronie WWW mamy bezpośredni odnośnik do pobierania. Na pewniej stronie pewnej amerykańskiej biblioteki cyfrowej wybór plików oraz sposobów pobierania był imponujący. Ale tylko jeden sposób mnie zainteresował. Właściwie to już od wielu lat zastanawiałem czemu nie jest on wykorzystywany powszechnie w bibliotekach cyfrowych. 

Jeśli chodzi o nasze podwórko to tłumaczę sobie to dużą popularnością plików DjVu oraz, że ten mechanizm był (trochę zapomniany) kojarzony z praktykami pirackimi. Chodzi o mianowicie o torrenty :)

Torrenty wg Wikipedii:

BitTorrent – protokół wymiany i dystrybucji plików przez Internet, którego celem jest odciążenie łączy serwera udostępniającego pliki. Jego największą zaletą w porównaniu do protokołu HTTP jest podział pasma pomiędzy osoby, które w tym samym czasie pobierają dany plik. Oznacza to, że użytkownik w czasie pobierania wysyła fragmenty pliku innym użytkownikom.

System jest zintegrowany ze stroną WWW serwera, a sam proces pobierania plików od strony użytkownika wygląda podobnie do kopiowania plików za pośrednictwem protokołu HTTP. Od strony serwera system składa się z udostępnionych publicznie metaplików o rozszerzeniu .torrent, trackera oraz programu wysyłającego pliki

Zasada działania

Protokół BitTorrent znacznie redukuje obciążenie łącza użytkowników udostępniających plik (seed). Kolorowe kropki pod klientami oznaczają różne fragmenty kopiowanego pliku. Fragment pliku po pobraniu od seeda jest następnie kopiowany pomiędzy pozostałymi klientami

Protokół BitTorrent umożliwia kopiowanie jednego pliku przez wielu użytkowników bez wielokrotnego obciążania serwera i jego łącza sieciowego. Po pierwsze, protokół BitTorrent umożliwia kopiowanie plików fragmentami, po drugie, jako źródło plików serwer wskazuje komputery użytkowników, którzy dany plik pobrali wcześniej lub są w trakcie jego pobierania. Dzięki temu kopiowanie pliku przebiega głównie pomiędzy komputerami użytkowników, tworzącymi wtedy sieć P2P. Użytkownik, który skopiował fragment pliku, udostępnia go innym użytkownikom. W ten sposób prędkość kopiowania pliku nie jest limitowana możliwościami serwera i jego łącza sieciowego, nawet gdy plik kopiowany jest przez wielu użytkowników naraz. W optymalnych warunkach serwer musi wysłać tylko jedną kopię pliku niezależnie od tego, jak dużo klientów chce posiadać jego kopię.

Na Wikipedii jest to dobrze opisane jak widać. Ja opiszę tak krócej: ściągam i instaluję odpowiedni program, ściągam plik torrent (metaplik), który zawiera informacje takie jak zawartość archiwum i adres trackera czy sumy kontrolne plików, które pozwalają  pobieranie. Mamy tu ważne dwie kwestie tj. Peer-y i Seed-y. Pierwszy to jest użytkownik, który pobiera i jednocześnie udostępnia dany plik. Drugi to użytkownik, który posiada kompletny plik i udostępnia go innym osobom. Przy pobieraniu ważne jest tzw. Share ratio tj. stosunek ilości danych wysłanych do pobranych. Im dany plik jest popularny tym szybciej możemy go pobrać, a także przekazać dalej innym użytkownikom. Umożliwiamy tym samym innym użytkownikom pobranie określonej ilości danych, jaką i my sami pobraliśmy.

Dla mnie wykorzystanie protokołów Bittorrent w bibliotekach cyfrowych jest fajnym pomysłem, niezależnie od wielkości i formatu pliku. Użytkownik nie potrzebuje jakieś zaawansowanej wiedzy na temat tych mechanizmów zwłaszcza że jest to wciąż popularna metoda. Mam nadzieje, że ktoś zauważy wreszcie potencjał tego mechanizmu w bibliotekach cyfrowych.


Brak komentarzy:

Prześlij komentarz

Prompty dla Archiwisty cz.1

Czas na nową serię „Prompty dla Archiwisty” , w której podzielę się pomysłami na wykorzystanie promptów w pracy archiwalnej. Znajdziesz tu z...