pbr-ocr-proj/lab2/Zadanie3.md

1.5 KiB

Poziom 1

Ustalenie tematu pracy, w naszym przypadku - Wyszukiwarka dla pdfów spełniająca wymagania wyszukiwania tekstu, obrazu i skanowania ocr..

Poziom 2

Stworzenie modeli do wykrywania i zczytywania tekstu ze skanów dokumentów w różnych formatach oraz do wykrywania obiektów typu: obrazek, tabelka, pismo odręczne. Powiązanie w/w obiektów z ich opisami. Zwrócenie kawałka dokumentu lub całej strony z szukaną frazą.

Poziom 3

Modele wykrywające w/w obiekty oraz rozpoznanie pisma w dokumentach.

Poziom 4

User-stories:

  1. Wyszukiwanie strony dokumentu po frazie
  2. Wyszukiwanie obrazka po frazie
  3. Wyszukiwany tekst jest zaznaczony
  4. Wyszukiwany obrazek jest zaznaczony

Poziom 5

Postawienie serwera na serwerze WMI lub Heroku, pozwolenie użytkownikom wyszukiwania po instniejących dokumentach.

Poziom 6

Rozbudowanie poprzedniego poziomu o możliwość wrzucania własnych dokumentów w różnych formatach np. pdf, jpg. Pozwolenie użytkownikowi użycia różnych filtrów.

Poziom 7

Postawienie projektu na serwerze dostawcy chmurowego, otwartego na świat.

Poziom 8

Pomyślne działanie systemu, wyszukiwanie po istniejących dokumentach oraz po dodanych przez użytkownika. Poprawne oznaczenia tekstów oraz obrazków.

Poziom 9

Możliwość zastosowania oprogramowania w wyszukiwaniu fraz w dużych zbiorach danych np. pracach naukowych.