Update on Overleaf.

This commit is contained in:
Alex Drożdż 2022-04-22 00:11:44 +00:00 committed by node
parent b35d173639
commit 422729ae56
2 changed files with 56 additions and 3 deletions

View File

@ -1,6 +1,27 @@
% here the bibliographic entry for the paper itself should be given,
% used for generating declarations
@article{COYLE2006641,
title = {Mass Digitization of Books},
journal = {The Journal of Academic Librarianship},
volume = {32},
number = {6},
pages = {641-645},
year = {2006},
issn = {0099-1333},
doi = {https://doi.org/10.1016/j.acalib.2006.08.002},
url = {https://www.sciencedirect.com/science/article/pii/S0099133306001534},
author = {Karen Coyle},
abstract = {Mass digitization of the bound volumes that we generally call “books” has begun, and, thanks to the interest in Google and all that it does, it is getting widespread media attention. The Open Content Alliance (OCA), a library initiative formed after Google announced its library book digitization project, has brought library digitization projects into the public eye, even though libraries were experimenting with digitization for at least a decade. What is different today from some earlier digitization of books is not just the scale of these new initiatives, but the quality of “mass.”}
}
@book{xie2016discover,
title={Discover digital libraries: Theory and practice},
author={Xie, Iris and Matusiak, Krystyna},
year={2016},
publisher={Elsevier}
}
@misc{Mazowieckiego2022Mar,
author = {Mazowieckiego, Biblioteka Publiczna m. {\relax st}. Warszawy- Biblioteka Glowna {\relax Woj}.},
title = {{Mazowiecka Biblioteka Cyfrowa - Strona g{\l}{\ifmmode\acute{o}\else\'{o}\fi}wna}},

View File

@ -1,6 +1,6 @@
% !TeX spellcheck = pl_PL
\chapter{Problematyka pozyskiwania obrazów ze zdigitalizowanych treści}
\chapter{Problematyka digitalizacji treści archiwalnych}
\section{Zagadnienie digitalizacji archiwalnych dokumentów i cyfrowej biblioteki}
\bigbreak
@ -29,8 +29,40 @@ Poniższe ilustracje przedstawiają przykład cyfrowej biblioteki, stronę głó
Ważną kwestią w kontekście dalszej części tej pracy jest rozróżnienie dwóch pojęć, a mianowicie digitalizacji i ekstrakcji treści. Digitalizacja to zamiana wersji papierowej dokumentu na jego cyfrowy odpowiednik, zaś proces ekstrakcji polega na wyodrębnieniu z niej interesujących elementów. Przekształcenie treści papierowych na cyfrowe jest pierwszym i najważniejszym krokiem, jednak to dopiero ekstrakcja treści zapewnia pełne wykorzystanie potencjału tej dziedziny i to właśnie ona stanowi temat przewodni niniejszej pracy magisterskiej \cite{digitalizacja}.
\section{Wyzwania digitalizacji}
\section{Proces digitalizacji i ekstrakcji treści}
Digitalizacja materiałów to proces proces przekształcania informacji analogowych do formatu cyfrowego poprzez skanowanie lub fotografię cyfrową. Materiały statyczne takie jak książki, artykuły czy inne dokumenty przedstawiane są w formacie cyfrowym za pomocą nieruchomych obrazów, natomiast media dynamiczne jak filmy przedstawiane są za pomocą cyfrowego dźwięku zsynchronizowanego z sekwencją obrazów. Niezależnie od rodzaju materiału analogowego lub używanego sprzętu, digitalizacja jest procesem wieloetapowym. Podstawowy cykl digitalizacji jest podobny dla wszystkich materiałów, a różni się głównie złożonością. Proces digitalizacji jest bardzo złożony i składa się z kilku podstawowych elementów, a są nimi:
\begin{itemize}
\item Planowanie projektu, wybór i przygotowanie materiałów do konwersji
\item Przechwytywanie obrazu
\item Cyfrowe przetwarzanie przechwyconych danych i tworzenie plików pochodnych
\item Zapisywanie metadanych
\item Wprowadzanie zdigitalizowanych obiektów i związanych z nimi metadanych do systemów zarządzania bibliotekami cyfrowymi
\item Konserwacja cyfrowa obiektów powstałych w wyniku procesu konwersji \cite{xie2016discover}
\end{itemize}
TERAZ TUTAJ OPISAĆ TE ELEMENTY NA PODSTAWIE RÓŻNYCH INNYCH PAPERÓW ALE TEŻ NA PODSTAWIE TEGO [9]
SELEKCJA TREŚCI NP. https://www.journals.ala.org/index.php/lrts/article/view/5012/6066
\newline
Istnieje również pojęcie masowej cyfryzacji czyli czegoś więcej aniżeli tylko projektu na dużą skalę jak np. digitalizacja kilku bibliotek miejskich zlecona przez władze danego miasta. Jest to digitalizacja materiałów na skalę przemysłową. Innymi słowy oznacza to przekształcanie całych bibliotek bez dokonywania selekcji poszczególnych materiałów z czym mamy do czynienia w przypadku pojedynczych instytucji. Celem masowej digitalizacji nie jest tworzenie wybranych kolekcji dzieł czy dokumentów, ale digitalizacja wszystkiego, czyli np. każdej książki, jaka kiedykolwiek została wydrukowana. Aby zrobić to efektywnie, masowa digitalizacja opiera się na wydajnym fotografowaniu książek strona po stronie i poddawaniu tych obrazów działaniu omówionego wcześniej oprogramowania do optycznego rozpoznawania znaków (OCR) w celu uzyskania tekstu, który można bez przeszkód przeszukiwać. Ludzki czynnik podczas masowej digitalizacji jest ograniczany do absolutnego minimum. Na samą myśl o masowej digitalizacji do głowy nasuwają się globalni liderzy technologiczni tacy jak Google. Celem tej korporacji jest zdigitalizowanie jak największej ilości książek znajdujących się w światowych bibliotekach i księgarniach. Gigant, który rozwija swoją usługę Google Books pozwala w niej na przeszukiwanie materiałów z możliwością podglądu kontekstu wyszukiwanych haseł. \cite{COYLE2006641}
A TERAZ TUTAJ JESZCZE BARDZIEJ OPISAĆ GOOGLE BOOKS + SCREENY FUNKCJONALNOŚCI ŻEBY TROCHE ZWIĘKSZYĆ OBJĘTOŚĆ
OPIS GOOGLE BOOKS NP. TUTAJ https://www.journals.ala.org/index.php/lrts/article/view/5108/6199
\newline
SZKIC PODROZDZIAŁU:
fajnje by bylo zaczac od tego jak nasteuje wgl selekcja
Masowe skanowanie + OCR + pozyskiwanie metadanych [standard: dublin core] + hand writing recognition
\section{Wyzwania i problemy digitalizacji}
Digitalizacja zasobów danego podmiotu to jednak nie tylko pozytywne strony, to również przedsięwzięcie, które wymaga zmierzenia się z wieloma wyzwaniami i potencjalnymi problemami. \cite{pandey2014digitization}
\section{Ekstrakcja treści ze zdigitalizowanych dokumentów}
stąd też \cite{xie2016discover}
\section{Opis projektu "Chronicling America"}
Jeszcze nie opis Newspapers navigator'a tylko całego dużego projketu digitalizacji treści z bibliotek na którym się on opierał