Update on Overleaf.

This commit is contained in:
Alex Drożdż 2022-05-08 15:39:43 +00:00 committed by node
parent 422729ae56
commit 4ecc68a7c5
2 changed files with 45 additions and 5 deletions

View File

@ -1,6 +1,26 @@
% here the bibliographic entry for the paper itself should be given,
% used for generating declarations
@book{bulow2011preparing,
title={Preparing collections for digitization},
author={B{\"u}low, Anna and Ahmon, Jess and Spencer, Ross},
year={2011},
publisher={Facet Publishing}
}
@article{Gertz2011Apr,
author = {Gertz, Janet},
title = {{Selection for Preservation in the Digital Age}},
journal = {Libr. Resources Tech. Serv.},
volume = {44},
number = {2},
pages = {97--104},
year = {2011},
month = apr,
issn = {2159-9610},
url = {https://www.journals.ala.org/index.php/lrts/article/view/5012/6066}
}
@article{COYLE2006641,
title = {Mass Digitization of Books},
journal = {The Journal of Academic Librarianship},

View File

@ -13,7 +13,7 @@ Dostęp i ochrona materiałów to główne powody, dla których instytucje podej
W dzisiejszych czasach proces cyfryzacji dużych zbiorów dokumentów często realizowany jest poprzez wykorzystanie specjalnych maszyn zapewniających szybkie skanowanie, dzięki czemu starsze dokumenty zapisuje się w postaci obrazów cyfrowych. Zazwyczaj dzieje się to równolegle z codziennym skanowaniem nowych dokumentów. Strategia codziennego skanowania jest niezbędna do całkowitego wyeliminowania papieru, ponieważ wszystkie nowe dokumenty od wybranej daty są skanowane, a instytucje nie przechowują już zapisów papierowych \cite{digitalizacja}. Takie dokumenty trafiają później do specjalnych systemów pozwalających na zarządzanie nimi w łatwy i przejrzysty sposób. W przypadku bibliotek istnieje pojęcie systemu zarządzania biblioteką cyfrową, czyli oprogramowania, które zapewnia funkcje tworzenia i zarządzania zdigitalizowanymi zasobami biblioteki oraz świadczenia usług dla jej użytkowników. Tego rodzaju systemy zazwyczaj pozwalają na swobodne dodawanie specjalistycznych oprogramowań w celu zaspokojenia konkretnych potrzeb danej jednostki oraz mogą być sprzedawane zarówno przez dostawców komercyjnych jak i być budowane w oparciu o zasoby typu open-source \cite{amollo2011digitization}. Istnieje też szersze pojęcie, a mianowicie wspomniana już biblioteka cyfrowa. Pojęcie to oznacza cały skomputeryzowany system sieciowy umożliwiający zapewnienie dostępu do wyszukiwania potrzebnych informacji dużej liczbie użytkowników biblioteki w jednoczesnym czasie i z dowolnego miejsca \cite{paliiits}. W porównaniu z tradycyjną biblioteką, biblioteka cyfrowa stanowi rewolucyjną zmianę, która zapewnia dużą szybkość i dokładność wyszukiwanych informacji. Tak długo, dopóki istnieje tytuł lub słowa kluczowe, poprzez dostęp do wyszukiwarki biblioteki cyfrowej czytelnik może w bardzo krótkim czasie uzyskać dostęp do potrzebnych mu materiałów \cite{xu2012importance}.
\newline
Poniższe ilustracje przedstawiają przykład cyfrowej biblioteki, stronę główną Mazowieckiej Biblioteki Cyfrowej oraz przykład wykorzystania panelu wyszukiwania do znalezienia interesującej użytkownika treści. W tym przypadku wyszukiwane było dzieło Henryka Sienkiewicza pt. "Krzyżacy". Po wyszukaniu otrzymano dostęp do czterech tomów jubileuszowego wydania tejże powieści, jest to doskonały przykład wartości jakie niesie za sobą digitalizacja, ponieważ to dzieło prawdopodobnie nie było by udostępnione do wypożyczenia ze względu na swoją unikatowość, lecz dzięki digitalizacji dostępne jest dla szerokiego grona użytkowników. \cite{Mazowieckiego2022Mar}
Poniższe ilustracje przedstawiają przykład cyfrowej biblioteki, stronę główną Mazowieckiej Biblioteki Cyfrowej oraz przykład wykorzystania panelu wyszukiwania do znalezienia interesującej użytkownika treści. W tym przypadku wyszukiwane było dzieło Henryka Sienkiewicza pt. "Krzyżacy". Po wyszukaniu otrzymano dostęp do czterech tomów jubileuszowego wydania tejże powieści, jest to doskonały przykład wartości jakie niesie za sobą digitalizacja, ponieważ to dzieło prawdopodobnie nie było by udostępnione do wypożyczenia ze względu na swoją unikatowość, lecz dzięki digitalizacji dostępne jest dla szerokiego grona użytkowników \cite{Mazowieckiego2022Mar}.
\begin{figure}[h!]
\centering
@ -32,18 +32,38 @@ Ważną kwestią w kontekście dalszej części tej pracy jest rozróżnienie dw
\section{Proces digitalizacji i ekstrakcji treści}
Digitalizacja materiałów to proces proces przekształcania informacji analogowych do formatu cyfrowego poprzez skanowanie lub fotografię cyfrową. Materiały statyczne takie jak książki, artykuły czy inne dokumenty przedstawiane są w formacie cyfrowym za pomocą nieruchomych obrazów, natomiast media dynamiczne jak filmy przedstawiane są za pomocą cyfrowego dźwięku zsynchronizowanego z sekwencją obrazów. Niezależnie od rodzaju materiału analogowego lub używanego sprzętu, digitalizacja jest procesem wieloetapowym. Podstawowy cykl digitalizacji jest podobny dla wszystkich materiałów, a różni się głównie złożonością. Proces digitalizacji jest bardzo złożony i składa się z kilku podstawowych elementów, a są nimi:
\begin{itemize}
\begin{enumerate}
\item Planowanie projektu, wybór i przygotowanie materiałów do konwersji
\item Przechwytywanie obrazu
\item Przechwytywanie obrazu
\item Cyfrowe przetwarzanie przechwyconych danych i tworzenie plików pochodnych
\item Zapisywanie metadanych
\item Wprowadzanie zdigitalizowanych obiektów i związanych z nimi metadanych do systemów zarządzania bibliotekami cyfrowymi
\item Konserwacja cyfrowa obiektów powstałych w wyniku procesu konwersji \cite{xie2016discover}
\end{enumerate}
Proces wyboru odpowiednich materiałów nie jest liniowy, nie wystarczy spełnić jednego kryterium by uznać dzieło za warte zdigitalizowania w pierwszej kolejności. Należy zadać sobie szereg pytań, gdzie jedna odpowiedź wpływa na kolejne. Popularne kryteria używane w procesie decyzyjnym to na przykład:
\begin{itemize}
\item[$\bullet$] Czy dzieło jest zniszczone lub zagrożone całkowitym zniszczeniem?
\item[$\bullet$] Czy ma wystarczająco trwałe wartości aby uzasadnić jej zdigitalizowanie? Mogą to być np. oprawa, ilustracje, unikatowość treści, znaczenie historyczne, zawarte w nim potencjalne długoterminowe wartości społeczne lub intelektualne.
\item[$\bullet$] Czy dzieło wymaga rekonstrukcji przed digitalizacją?
\item[$\bullet$] Jakie możliwości konserwacji są dostępne przed zdigitalizowaniem pozycji, biorąc pod uwagę fizyczny charakter obiektu oraz jego obecne i przyszłe wykorzystanie? Czy można je naprawić? Jeśli nie, to czy kopia konserwatorska może z powodzeniem uchwycić jej zawartość i pomóc w obecnym i przyszłym użytkowaniu? Czy istnieją czynniki które obniżają jakość dzieła, takie jak utrata barw ilustracji, rozmyty tekst, brakujące lub porwane strony.
\item[$\bullet$] Jaki jest koszt odnowienia i zdigitalizowania danej pozycji?
\item[$\bullet$] Czy instytucja posiada prawo do zdigitalizowania i rozpowszechnienia publikacji?
\item[$\bullet$] Czy na dane dzieło będzie popyt wśród aktualnych odbiorców?
\item[$\bullet$] Czy instytucja posiada wystarczające środki finansowe i infrastrukturę do przeprowadzanie digitalizacji?
\item[$\bullet$] Czy digitalizacja przyniesie jakiekolwiek inne skutki niż tylko utworzenie cyfrowej kopii publikacji? \cite{Gertz2011Apr}
\end{itemize}
TERAZ TUTAJ OPISAĆ TE ELEMENTY NA PODSTAWIE RÓŻNYCH INNYCH PAPERÓW ALE TEŻ NA PODSTAWIE TEGO [9]
Sam wybór pozycji które mogą w danym momencie zostać zdigitalizowane nie jest jedynym krokiem, który należy wykonać przed przejściem do faktycznych prac. W rzeczywistości kluczowe jest również określenie czynników takich jak budżet, oś czasu, odpowiednio wykwalifikowany personel, a także cele końcowe jakie mają zostać osiągnięte poprzez zdigitalizowanie danej kolekcji dzieł. Instytucje często nie muszą posiadać własnego budżetu, aby sfinansować digitalizacje pewnej kolekcji książek, czy dokumentów. Bardzo często do takich miejsc zgłaszają się firmy komercyjne zainteresowane pozyskaniem pewnych danych, czy informacji. Gotowe są one sfinansować takie działanie w celu uzyskania dostępu do zdigitalizowanych pozycji i wykorzystać je na własny użytek. Oczywiście wówczas kluczowym pytaniem, które już zostało wspomniane wcześniej, jest czy dana instytucja posiada odpowiednie prawa, aby taką inicjatywę przeprowadzić. Takim przykładem są firmy, które zajmują się historycznymi dziejami rodzin, ich celem są wówczas wszelakiego rodzaju dokumenty archiwalne posiadające poszukiwane przez nich nazwiska. Podobnie wygląda sytuacja z instytucjami, które przeprowadzają badania statystyczne i potrzebują dostępu do historycznych statystyk i danych \cite{bulow2011preparing}.
\newline
SELEKCJA TREŚCI NP. https://www.journals.ala.org/index.php/lrts/article/view/5012/6066
Kolejnym etapem procesu digitalizacji jest pozyskiwanie obrazu dzieł, które zostały wybrane podczas poprzednio omawianego procesu selekcji. Etap ten jest sercem całego procesu. Do przechwytywania obrazu używa się skanerów, aparatów cyfrowych lub specjalnych konwerterów analogowo-cyfrowych, które przekształcają analogowe wersje książek, czy dokumentów w sygnały cyfrowe. Proces ten może być wykonywany wewnętrznie lub zlecony wykwalifikowanej w kwestii digitalizacji firmie komercyjnej. Najważniejszym elementem tego procesu jest dokładne odzwierciedlenie analogowej wersji materiałów źródłowych i ich zgodność z pierwotnymi założeniami procesu \cite{xie2016discover}.
\newline
Następne punkty procesu związane są głównie z pojęciem metadanych.
DALEJ OPISYWAĆ TO CO TAM WYPUNKTOWANE WYŻEJ Z [9]
\newline
Istnieje również pojęcie masowej cyfryzacji czyli czegoś więcej aniżeli tylko projektu na dużą skalę jak np. digitalizacja kilku bibliotek miejskich zlecona przez władze danego miasta. Jest to digitalizacja materiałów na skalę przemysłową. Innymi słowy oznacza to przekształcanie całych bibliotek bez dokonywania selekcji poszczególnych materiałów z czym mamy do czynienia w przypadku pojedynczych instytucji. Celem masowej digitalizacji nie jest tworzenie wybranych kolekcji dzieł czy dokumentów, ale digitalizacja wszystkiego, czyli np. każdej książki, jaka kiedykolwiek została wydrukowana. Aby zrobić to efektywnie, masowa digitalizacja opiera się na wydajnym fotografowaniu książek strona po stronie i poddawaniu tych obrazów działaniu omówionego wcześniej oprogramowania do optycznego rozpoznawania znaków (OCR) w celu uzyskania tekstu, który można bez przeszkód przeszukiwać. Ludzki czynnik podczas masowej digitalizacji jest ograniczany do absolutnego minimum. Na samą myśl o masowej digitalizacji do głowy nasuwają się globalni liderzy technologiczni tacy jak Google. Celem tej korporacji jest zdigitalizowanie jak największej ilości książek znajdujących się w światowych bibliotekach i księgarniach. Gigant, który rozwija swoją usługę Google Books pozwala w niej na przeszukiwanie materiałów z możliwością podglądu kontekstu wyszukiwanych haseł. \cite{COYLE2006641}