10 lines
604 B
TeX
10 lines
604 B
TeX
\chapter*{Streszczenie}
|
|
Praca przedstawia proces tworzenia systemu ekstrakcji informacji o godzinach
|
|
rozpoczęcia mszy świętych. Opisane zostają sposoby zbierania danych o polskich
|
|
parafiach, w szczególności proces tworzenia pająków. Następnie pokazane zostają
|
|
dwie metody ekstrakcji godzin rozpoczęcia mszy świętych: regułowa i oparta na
|
|
uczeniu maszynowym. Większa uwaga zostaje poświęcona metodzie opartej na uczeniu
|
|
maszynowym, która polega na wykorzystaniu klasyfikatora tekstu.
|
|
|
|
\textbf{Słowa kluczowe:} ekstrakcja informacji, indeksowanie stron
|
|
internetowych, klasyfikacja tekstu |