This commit is contained in:
Filip Gralinski 2021-04-07 12:35:40 +02:00
parent f9b516bdf4
commit 73286e2803

View File

@ -10,7 +10,13 @@
"\n", "\n",
"Na tych ćwiczeniach omówimy silnik Solr.\n", "Na tych ćwiczeniach omówimy silnik Solr.\n",
"\n", "\n",
"Jeżeli chcą Państwo wejść w temat wyszukiwarek głębiej niż na zajęciach, polecam dobrą, darmową książkę: https://www.manning.com/books/relevant-search#toc . Opiera się on na Elastisearch, ale nie stanowi to większego problemu." "Jeżeli chcą Państwo wejść w temat wyszukiwarek głębiej niż na zajęciach, polecam dobrą, darmową książkę: https://www.manning.com/books/relevant-search#toc . Opiera się on na Elastisearch, ale nie stanowi to większego problemu.\n",
"\n",
"## Schematy budowy aplikacji-wyszukiwarki\n",
"\n",
"![](solr1.png)\n",
"\n",
"![](solr2.png)\n"
] ]
}, },
{ {
@ -40,29 +46,37 @@
"\n", "\n",
"Proszę stworzyć wyszukiwarkę dla wybranej kolekcji dokumentów (innej niż przykładowe w solr).\n", "Proszę stworzyć wyszukiwarkę dla wybranej kolekcji dokumentów (innej niż przykładowe w solr).\n",
"\n", "\n",
"**Warunki konieczne do zaliczenia zadania**:\n", "## Warunki konieczne do zaliczenia zadania\n",
" - użycie gotowego silnika wuszukiwarki (np. Solr lub Elastisearch)\n",
" - zaindeksowanie conajmniej 40 tys. dokumentów\n",
" - zaimplementowanie frontendu w postaci aplikacji webowej. Użytkownik nie ma korzystać z panelu admina. Aplikacja webowa może być napisana w dowolnym języku/frameworku.\n",
" - dokumenty powinny stanowić sensowną, rzeczywistą kolekcję. Proszę nie losować dokumentów, powielać, itp.\n",
" \n", " \n",
"**Punktacja**:\n", " * użycie gotowego silnika wuszukiwarki (np. Solr lub Elastisearch)\n",
" - wersja podstawowa: 60 punktów\n", " * zaindeksowanie conajmniej 40 tys. dokumentów\n",
" - interesujący (np. niedostępny w Googleu) zbiór dokumentów: +20 punktów\n", " * zaimplementowanie frontendu w postaci aplikacji webowej. Użytkownik nie ma korzystać z panelu admina. Aplikacja webowa może być napisana w dowolnym języku/frameworku.\n",
" - zaawansowane przetwarzanie językowe tekstu: +20 punktów\n", " * dokumenty powinny stanowić sensowną, rzeczywistą kolekcję. Proszę nie losować dokumentów, powielać, itp.\n",
" - zaznaczanie słów kluczowych (highlighting): +10 punktów\n",
" - zaawansowane opcje sortowania: +10 punktów\n",
" - zaawansowane opcje filtrowania: +10 punktów\n",
" - zindeksowanie > 0,5 mln dokumentów: +20 punktów, > 5 mln - +40 punktów\n",
" - wizualizacja (wykres, mapa): +20 punktów\n",
" - użycie ciekawej funkcji niewymienionej wyżej: +20 punktów\n",
" - maksimum do zdobycia z tego zadania: 160 punktów\n",
" \n", " \n",
"**Zaliczenie**:\n", "## Punktacja\n",
" - termin zaliczenia to 20.04 (na zajęciach)\n", " * wersja podstawowa: 60 punktów\n",
" - proszę zaznaczyć w MS TEAMS, że Państwo zrobili zadanie w assigments\n", " * interesujący (np. niedostępny w Googleu) zbiór dokumentów: +20 punktów\n",
" - zdawanie zadania będzie na zajęciach. Proszę przygotować prezentację do 5 minut" " * zaawansowane przetwarzanie językowe tekstu: +20 punktów\n",
" * zaznaczanie słów kluczowych (highlighting): +10 punktów\n",
" * zaawansowane opcje sortowania: +10 punktów\n",
" * zaawansowane opcje filtrowania: +10 punktów\n",
" * zindeksowanie > 0,5 mln dokumentów: +20 punktów, > 5 mln - +40 punktów\n",
" * wizualizacja (wykres, mapa): +20 punktów\n",
" * użycie ciekawej funkcji niewymienionej wyżej: +20 punktów\n",
" * maksimum do zdobycia z tego zadania: 160 punktów\n",
" \n",
"## Zaliczenie\n",
" * termin zaliczenia to 20.04 (na zajęciach)\n",
" * proszę zaznaczyć w MS TEAMS, że Państwo zrobili zadanie w assigments\n",
" * zdawanie zadania będzie na zajęciach. Proszę przygotować prezentację do 5 minut"
] ]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
} }
], ],
"metadata": { "metadata": {
@ -81,7 +95,7 @@
"name": "python", "name": "python",
"nbconvert_exporter": "python", "nbconvert_exporter": "python",
"pygments_lexer": "ipython3", "pygments_lexer": "ipython3",
"version": "3.8.3" "version": "3.9.1"
} }
}, },
"nbformat": 4, "nbformat": 4,