msc-drozdz/abstract-pl.tex

3 lines
1.7 KiB
TeX
Raw Normal View History

2022-09-05 11:51:38 +02:00
% !TeX encoding = UTF-8
% !TeX spellcheck = pl_PL
2022-09-14 20:36:12 +02:00
Niniejsza praca magisterska traktuje w głównej mierze o ważności pojęcia digitalizacji skupiając się przede wszystkim na instytucjach jakimi są biblioteki. Przedstawione zostaje pojęcie cyfrowej biblioteki, procesu digitalizacji treści, które będą w niej przechowywane, a także wyzwań i problemów towarzyszącym całemu przedsięwzięciu. Praca ma charakter praktyczny, a jej głównym celem oprócz przekazania wartości informacyjnych związanych z pojęciem cyfryzacji, a także metod głębokiego uczenia maszynowego jest przedstawienie całego procesu budowania rozwiązania pozwalającego na przeszukiwanie ogromnych zbiorów danych zawierających dokumenty poddane już procesowi digitalizacji. Opisany w niej został również inicjatywa Chronicling America prowadzony na terenie Stanów Zjednoczonych w ostatnich latach. Powstały w ramach tej inicjatywy projekt Newspaper Navigator stał się główną inspiracją tematu niniejszej pracy i jej swego rodzaju pierwowzorem. Finalnym produktem zrodzonym z tej pracy dyplomowej jest zbadanie podejścia do przeszukiwania historycznych zdigitalizowanych zbiorów, czego z kolei efektem jest w pełni funkcjonalne oprogramowanie wyszukiwawcze oparte o przetwarzanie obrazów przez sztuczne sieci neuronowe, a także techniki przetwarzania języka naturalnego. Opisany zostanie cały proces budowy począwszy od pozyskania i przetworzenia danych wejściowych, przechodząc przez tworzenie własnego modelu detekcji obrazów, a także optyczne rozpoznawanie znaków i silnik wyszukiwania pełno tekstowego, a kończąc na warstwie wizualnej pozwalającej na obsługiwanie zapytań użytkownika w czasie rzeczywistym.