Ustalenie tematu pracy, w naszym przypadku - Wyszukiwarka dla pdfów spełniająca wymagania wyszukiwania tekstu, obrazu i skanowania ocr..
Stworzenie modeli do wykrywania i zczytywania tekstu ze skanów dokumentów w różnych formatach oraz do wykrywania obiektów typu: obrazek, tabelka, pismo odręczne. Powiązanie w/w obiektów z ich opisami. Zwrócenie kawałka dokumentu lub całej strony z szukaną frazą.
Modele wykrywające w/w obiekty oraz rozpoznanie pisma w dokumentach.
User-stories:
Postawienie serwera na serwerze WMI lub Heroku, pozwolenie użytkownikom wyszukiwania po instniejących dokumentach.
Rozbudowanie poprzedniego poziomu o możliwość wrzucania własnych dokumentów w różnych formatach np. pdf, jpg. Pozwolenie użytkownikowi użycia różnych filtrów.
Postawienie projektu na serwerze dostawcy chmurowego, otwartego na świat.
Pomyślne działanie systemu, wyszukiwanie po istniejących dokumentach oraz po dodanych przez użytkownika. Poprawne oznaczenia tekstów oraz obrazków.
Możliwość zastosowania oprogramowania w wyszukiwaniu fraz w dużych zbiorach danych np. pracach naukowych.