Update on Overleaf.

This commit is contained in:
Alex Drożdż 2022-04-03 16:34:20 +00:00 committed by node
parent e09bab69c1
commit b35d173639
9 changed files with 130 additions and 37 deletions

View File

@ -1,22 +1,100 @@
% here the bibliographic entry for the paper itself should be given, % here the bibliographic entry for the paper itself should be given,
% used for generating declarations % used for generating declarations
@misc{Mazowieckiego2022Mar,
author = {Mazowieckiego, Biblioteka Publiczna m. {\relax st}. Warszawy- Biblioteka Glowna {\relax Woj}.},
title = {{Mazowiecka Biblioteka Cyfrowa - Strona g{\l}{\ifmmode\acute{o}\else\'{o}\fi}wna}},
year = {2022},
month = {Mar},
publisher = {Biblioteka Publiczna m.st. Warszawy - Biblioteka Glowna Woj. Mazowieckiego},
note = {[Online; accessed 31. Mar. 2022]},
url = {http://mbc.cyfrowemazowsze.pl/dlibra}
}
@article{pandey2014digitization,
title={Digitization of library materials in academic libraries: Issues and challenges},
author={Pandey, Prabhat and Misra, Roli},
journal={Journal of industrial and intelligent information},
volume={2},
number={2},
year={2014},
publisher={Citeseer}
}
@article{paliiits,
title={IIITs Libraries Moving towards Digitalization: A study of IIIT Allahabad and IIIT \& M Gwalior Libraries},
author={Pal, Amit Kumar and Saini, Surbhi and Jain, Pragati}
}
@incollection{xu2012importance,
title={Importance and Challenges of Digital Construction for Academic Library},
author={Xu, Mingfeng},
booktitle={Knowledge Discovery and Data Mining},
pages={533--537},
year={2012},
publisher={Springer}
}
@article{bivscandigitalization,
title={DIGITALIZATION OF OLD NEWSPAPERS},
author={Bi{\v{s}}{\'c}an, Frida},
journal={JUNI NA UNI},
pages={119}
}
@inproceedings{amollo2011digitization,
title={Digitization for libraries in Kenya},
author={Amollo, Beatrice Adera},
booktitle={2nd International Conference on African Digital Libraries and Archives (ICADLA-2), University of Witwatersrand, Johannesburg, South Africa},
pages={14--18},
year={2011}
}
@article{Fabunmi2009Feb,
author = {Fabunmi, Beatrice Ayodeji and Paris, Matthew and Fabunmi, Martins},
title = {{Digitization of Library Resources: Challenges and Implications For Policy and Planning}},
journal = {International Journal of African {\&} African- American Studies},
volume = {5},
number = {2},
year = {2009},
month = {Feb},
url = {https://ojcs.siue.edu/ojs/index.php/ijaaas/article/view/80}
}
@article{digitalizacja,
title = {The Migration from Paper to Digital: Why Digitization Remains Elusive},
year = {2019},
month = {Dec},
note = {[Online; accessed 27. Mar. 2022]},
url = {https://www.alarisworld.com/-/media/files/im/insights/articles/2020/idc-paperfree-wp-dec-2019.pdf},
author = {Allison Correia and Robert Palmer},
}
@misc{nosnik-danych,
title = {Jak zmienia{\l}y si{\k{e}} no{\ifmmode\acute{s}\else\'{s}\fi}niki danych na przestrzeni lat},
journal = {PCElite},
year = {2016},
month = {Sep},
note = {[Online; accessed 27. Mar. 2022]},
url = {https://pcelite.pl/jak-zmienialy-sie-nosniki-danych-na-przestrzeni-lat}
}
@article{Lopatin2006Apr,
author = {Lopatin, Laurie},
title = {{Library digitization projects, issues and guidelines: A survey of the literature}},
journal = {Library Hi Tech},
year = {2006},
month = {Apr},
publisher = {Emerald Group Publishing Limited},
doi = {10.1108/07378830610669637}
}
@InProceedings{this-paper, @InProceedings{this-paper,
author="MSc Title", author="MSc Title",
title="Alex Drożdż", title="Alex Drożdż",
year=2021 year=2021
} }
@misc{BibEntry2020May,
title = {{Newspaper Navigator {$\vert$} Experiments {$\vert$} Work {$\vert$} Library of Congress}},
journal = {Library of Congress},
year = {2020},
month = {May},
note = {[Online; accessed 19. Mar. 2022]},
url = {https://news-navigator.labs.loc.gov}
}
@inproceedings{gralinski-etal-2019-geval, @inproceedings{gralinski-etal-2019-geval,
title = "{GE}val: Tool for Debugging {NLP} Datasets and Models", title = "{GE}val: Tool for Debugging {NLP} Datasets and Models",
author = "Grali{\'n}ski, Filip and author = "Grali{\'n}ski, Filip and

View File

@ -1,9 +1,36 @@
% !TeX encoding = UTF-8
% !TeX spellcheck = pl_PL % !TeX spellcheck = pl_PL
\chapter{Problematyka pozyskiwania obrazów ze zdigitalizowanych treści}
\section{Tytuł chapter 1} \section{Zagadnienie digitalizacji archiwalnych dokumentów i cyfrowej biblioteki}
\bigbreak
Coraz powszechniejszym zjawiskiem wśród instytucji takich jak biblioteki, archiwa państwowe, czy urzędy, które posiadają dostęp do niezliczonych zbiorów dokumentów, jest poddawanie ich procesowi cyfrowej archiwizacji. Przez tysiąclecia od momentu wynalezienia i rozpowszechnienia papieru jako nośnika informacji, był on jedynym efektywnym sposobem przekazywania sobie treści i to właśnie w tej postaci przechowywany był praktycznie cały dorobek kulturowy i naukowy ludzkości. Dopiero powszechny dostęp do komputera, a także wynalezienie narzędzi takich jak skaner, czy dyskietka zapoczątkowało możliwość przeniesienia dowolnego fizycznego dokumentu do przestrzeni cyfrowej i ich swobodnej wymiany \cite{nosnik-danych}.
\newline
\subsection{Tytuł subsection 1} Dostęp i ochrona materiałów to główne powody, dla których instytucje podejmują projekty digitalizacji. Dzięki digitalizacji można zapewnić dostęp do wszelkiego rodzaju materiałów takich jak teksty, fotografie, rękopisy, materiały audio i wideo. Digitalizacja pozwala także na zachowanie rzadkich lub delikatnych materiałów w pełni zabezpieczonymi przed wszelakiego rodzaju zagrożeniami mechanicznymi. Takie działanie minimalizuje ryzyko utraty ważnych zbiorów, które w postaci cyfrowej są łatwo replikowanie i przechowywane na wielu serwerach czy urządzeniach. A przecież wiadomo, że najważniejsza zawsze powinny być wiedza i informacje zawarte w książkach, czy innych materiałach, a nie sama ich okładka. Pozwala to również oferować nowe usługi takie jak przeszukiwanie i odnajdywanie wybranych zbiorów w ciągu zaledwie kilku kliknięć w systemie, często też bez konieczności odwiedzenia gmachu którejkolwiek z instytucji. Pozwala to również lepiej kontrolować zbiory, a także redukuje koszty i trudności transportu dokumentów pomiędzy placówkami \cite{Lopatin2006Apr}. W przypadku bibliotek często też motywem przewodnim dokonywanej digitalizacji jest chęć rozpowszechnienia materiałów niezwykle cennych, objętych specjalnymi programami czy funduszami ochronnymi, przez co sama możliwość ich przeglądania jest bardzo mocno ograniczana i kontrolowana, a możliwość wypożyczenia i przestudiowania w domowym zaciszu bardzo często wręcz niemożliwa \cite{bivscandigitalization}. Ponadto dzięki powszechnej dygitalizacji swobodna wymiana dzieł między podmiotami oddalonymi od siebie o setki, czy tysiące kilometrów nie stanowi logistycznego wyzwania.
\newline
Test cytowania \cite{BibEntry2020May} W dzisiejszych czasach proces cyfryzacji dużych zbiorów dokumentów często realizowany jest poprzez wykorzystanie specjalnych maszyn zapewniających szybkie skanowanie, dzięki czemu starsze dokumenty zapisuje się w postaci obrazów cyfrowych. Zazwyczaj dzieje się to równolegle z codziennym skanowaniem nowych dokumentów. Strategia codziennego skanowania jest niezbędna do całkowitego wyeliminowania papieru, ponieważ wszystkie nowe dokumenty od wybranej daty są skanowane, a instytucje nie przechowują już zapisów papierowych \cite{digitalizacja}. Takie dokumenty trafiają później do specjalnych systemów pozwalających na zarządzanie nimi w łatwy i przejrzysty sposób. W przypadku bibliotek istnieje pojęcie systemu zarządzania biblioteką cyfrową, czyli oprogramowania, które zapewnia funkcje tworzenia i zarządzania zdigitalizowanymi zasobami biblioteki oraz świadczenia usług dla jej użytkowników. Tego rodzaju systemy zazwyczaj pozwalają na swobodne dodawanie specjalistycznych oprogramowań w celu zaspokojenia konkretnych potrzeb danej jednostki oraz mogą być sprzedawane zarówno przez dostawców komercyjnych jak i być budowane w oparciu o zasoby typu open-source \cite{amollo2011digitization}. Istnieje też szersze pojęcie, a mianowicie wspomniana już biblioteka cyfrowa. Pojęcie to oznacza cały skomputeryzowany system sieciowy umożliwiający zapewnienie dostępu do wyszukiwania potrzebnych informacji dużej liczbie użytkowników biblioteki w jednoczesnym czasie i z dowolnego miejsca \cite{paliiits}. W porównaniu z tradycyjną biblioteką, biblioteka cyfrowa stanowi rewolucyjną zmianę, która zapewnia dużą szybkość i dokładność wyszukiwanych informacji. Tak długo, dopóki istnieje tytuł lub słowa kluczowe, poprzez dostęp do wyszukiwarki biblioteki cyfrowej czytelnik może w bardzo krótkim czasie uzyskać dostęp do potrzebnych mu materiałów \cite{xu2012importance}.
\newline
Poniższe ilustracje przedstawiają przykład cyfrowej biblioteki, stronę główną Mazowieckiej Biblioteki Cyfrowej oraz przykład wykorzystania panelu wyszukiwania do znalezienia interesującej użytkownika treści. W tym przypadku wyszukiwane było dzieło Henryka Sienkiewicza pt. "Krzyżacy". Po wyszukaniu otrzymano dostęp do czterech tomów jubileuszowego wydania tejże powieści, jest to doskonały przykład wartości jakie niesie za sobą digitalizacja, ponieważ to dzieło prawdopodobnie nie było by udostępnione do wypożyczenia ze względu na swoją unikatowość, lecz dzięki digitalizacji dostępne jest dla szerokiego grona użytkowników. \cite{Mazowieckiego2022Mar}
\begin{figure}[h!]
\centering
\includegraphics[width=0.8\textwidth]{digital_library.png}
\caption{Strona główna Mazowieckiej Biblioteki Cyfrowej \cite{Mazowieckiego2022Mar}.}
\end{figure}
\begin{figure}[h!]
\centering
\includegraphics[width=0.88\textwidth]{digital_library1.png}
\caption{Przykład wyszukiwania dzieła w bibliotece cyfrowej \cite{Mazowieckiego2022Mar}.}
\end{figure}
Ważną kwestią w kontekście dalszej części tej pracy jest rozróżnienie dwóch pojęć, a mianowicie digitalizacji i ekstrakcji treści. Digitalizacja to zamiana wersji papierowej dokumentu na jego cyfrowy odpowiednik, zaś proces ekstrakcji polega na wyodrębnieniu z niej interesujących elementów. Przekształcenie treści papierowych na cyfrowe jest pierwszym i najważniejszym krokiem, jednak to dopiero ekstrakcja treści zapewnia pełne wykorzystanie potencjału tej dziedziny i to właśnie ona stanowi temat przewodni niniejszej pracy magisterskiej \cite{digitalizacja}.
\section{Wyzwania digitalizacji}
Digitalizacja zasobów danego podmiotu to jednak nie tylko pozytywne strony, to również przedsięwzięcie, które wymaga zmierzenia się z wieloma wyzwaniami i potencjalnymi problemami. \cite{pandey2014digitization}
\section{Ekstrakcja treści ze zdigitalizowanych dokumentów}

View File

@ -2,4 +2,4 @@
% !TeX spellcheck = pl_PL % !TeX spellcheck = pl_PL
\section{Tytuł chapter 2} \chapter{Tytuł chapter 2}

View File

@ -2,4 +2,4 @@
% !TeX spellcheck = pl_PL % !TeX spellcheck = pl_PL
\section{Tytuł chapter 3} \chapter{Tytuł chapter 3}

View File

@ -2,4 +2,4 @@
% !TeX spellcheck = pl_PL % !TeX spellcheck = pl_PL
\section{Tytuł chapter 4} \chapter{Tytuł chapter 4}

BIN
digital_library.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 511 KiB

BIN
digital_library1.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 416 KiB

View File

@ -1,17 +0,0 @@
\section{Main}
This is a~sample paper~\cite{gonito2016}.
See the experiments described \bycite{gonito2016}.
Please put your content here.
\subsection{Gonito}
Gonito submission should be referenced like this
\gonitoscore{6ab4979e4629c5559feba452b7ca74c0cac89ebb}%
\footnote{Reference codes to repositories stored at
Gonito.net~\cite{gonito2016} are given in curly brackets. Such a~repository may be also accessed by going
to \url{http://gonito.net/q} and entering the code there.}

View File

@ -13,8 +13,11 @@
\documentclass[oneside,polski,logo]{amuthesis} \documentclass[oneside,polski,logo]{amuthesis}
% Zdefiniuj kodowanie pliku źródłowego (domyślnie utf8) % Zdefiniuj kodowanie pliku źródłowego (domyślnie utf8)
\usepackage{polski}
\usepackage[utf8]{inputenc} \usepackage[utf8]{inputenc}
\usepackage{authblk} \usepackage{authblk}
\usepackage[demo]{graphicx}
\usepackage{subfig}
\input{metadata} \input{metadata}
@ -68,17 +71,19 @@ Tu możesz umieścić swoją dedykację.
% Spis treści % Spis treści
\tableofcontents \tableofcontents
\clearpage
% ======================================================== % % ======================================================== %
% Właściwa część pracy % % Właściwa część pracy %
% ======================================================== % % ======================================================== %
\input{main}
\input{chapter1} \input{chapter1}
\clearpage
\input{chapter2} \input{chapter2}
\clearpage
\input{chapter3} \input{chapter3}
\clearpage
\input{chapter4} \input{chapter4}
\clearpage
\bibliographystyle{unsrt} \bibliographystyle{unsrt}
\bibliography{bibliography} \bibliography{bibliography}