1.5 KiB
Poziom 1
Ustalenie tematu pracy, w naszym przypadku - Wyszukiwarka dla pdfów spełniająca wymagania wyszukiwania tekstu, obrazu i skanowania ocr..
Poziom 2
Stworzenie modeli do wykrywania i zczytywania tekstu ze skanów dokumentów w różnych formatach oraz do wykrywania obiektów typu: obrazek, tabelka, pismo odręczne. Powiązanie w/w obiektów z ich opisami. Zwrócenie kawałka dokumentu lub całej strony z szukaną frazą.
Poziom 3
Modele wykrywające w/w obiekty oraz rozpoznanie pisma w dokumentach.
Poziom 4
User-stories:
- Wyszukiwanie strony dokumentu po frazie
- Wyszukiwanie obrazka po frazie
- Wyszukiwany tekst jest zaznaczony
- Wyszukiwany obrazek jest zaznaczony
Poziom 5
Postawienie serwera na serwerze WMI lub Heroku, pozwolenie użytkownikom wyszukiwania po instniejących dokumentach.
Poziom 6
Rozbudowanie poprzedniego poziomu o możliwość wrzucania własnych dokumentów w różnych formatach np. pdf, jpg. Pozwolenie użytkownikowi użycia różnych filtrów.
Poziom 7
Postawienie projektu na serwerze dostawcy chmurowego, otwartego na świat.
Poziom 8
Pomyślne działanie systemu, wyszukiwanie po istniejących dokumentach oraz po dodanych przez użytkownika. Poprawne oznaczenia tekstów oraz obrazków.
Poziom 9
Możliwość zastosowania oprogramowania w wyszukiwaniu fraz w dużych zbiorach danych np. pracach naukowych.