Poziom 1

Ustalenie tematu pracy, w naszym przypadku - Wyszukiwarka dla pdfów spełniająca wymagania wyszukiwania tekstu, obrazu i skanowania ocr..

Poziom 2

Stworzenie modeli do wykrywania i zczytywania tekstu ze skanów dokumentów w różnych formatach oraz do wykrywania obiektów typu: obrazek, tabelka, pismo odręczne. Powiązanie w/w obiektów z ich opisami. Zwrócenie kawałka dokumentu lub całej strony z szukaną frazą.

Poziom 3

Modele wykrywające w/w obiekty oraz rozpoznanie pisma w dokumentach.

Poziom 4

User-stories:

Wyszukiwanie strony dokumentu po frazie
Wyszukiwanie obrazka po frazie
Wyszukiwany tekst jest zaznaczony
Wyszukiwany obrazek jest zaznaczony

Poziom 5

Postawienie serwera na serwerze WMI lub Heroku, pozwolenie użytkownikom wyszukiwania po instniejących dokumentach.

Poziom 6

Rozbudowanie poprzedniego poziomu o możliwość wrzucania własnych dokumentów w różnych formatach np. pdf, jpg. Pozwolenie użytkownikowi użycia różnych filtrów.

Poziom 7

Postawienie projektu na serwerze dostawcy chmurowego, otwartego na świat.

Poziom 8

Pomyślne działanie systemu, wyszukiwanie po istniejących dokumentach oraz po dodanych przez użytkownika. Poprawne oznaczenia tekstów oraz obrazków.

Poziom 9

Możliwość zastosowania oprogramowania w wyszukiwaniu fraz w dużych zbiorach danych np. pracach naukowych.

1.5 KiB Raw Blame History