concordia-library/TODO.txt
rjawor 8f953883bf anubis search continued
Former-commit-id: 95a08f242a03311d067303bfff07bf4890796da5
2014-06-24 18:23:46 +02:00

14 lines
547 B
Plaintext

DONE 1. lokalizowane to_lower (wykorzystać utf8case, naprawić testy)
DONE 2. anonimizacja zdań
DONE 3. Dzielenie zdań (max 255 tokenów)
- concordia-server
- zastanowić się nad empty hash examples
zastanowić się nad optymalizacją:
- unordered_map tmMatchesMap
- LCP array
Anubis search się komplikuje! Przy tworzeniu obiektu tmMatches dla przykładu trzeba podać id przykładu, długość patternu i długość przykładu. Dwa pierwsze mamy, ale niestety nie ma skąd wziąć długości przykładu. Pamiętamy tylko offset sufiksu.