From d9112e209a3d8d3e369301d6821287a8c4a6f02e Mon Sep 17 00:00:00 2001 From: rjawor Date: Tue, 21 Apr 2015 21:54:28 +0200 Subject: [PATCH] updated TODO, concordia is not slower after all Former-commit-id: 3621c98c7e30f4a446dcc4b64671e336f1b27f44 --- TODO.txt | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git a/TODO.txt b/TODO.txt index c28a552..24624fe 100644 --- a/TODO.txt +++ b/TODO.txt @@ -1,15 +1,16 @@ -- wyłączyć stopWords IN PROGRESS - concordia search zwraca pozycje tokenów z hash'a. Jak to odnieść do examples w korpusie? - testy zużycia pamięci - Prawdopodobnie długość example w markers będzie potrzebna tylko anubisowi (który, jak się okazuje, jest wolny). Pomyśleć, do czego można wykorzystać markery, bo ich idea wydaje się niezła. - Multi-threading? - concordia-server (zastanowić się, czy nie napisać CAT-a) -- zastanowić się nad empty hash examples (rozwiązanie: w ogóle nie szukać fraz o pustym hashu, rzucać wyjątek). - puścić 100% search test na jrc ---------------------------- Archive ----------------------------- +REJECTED - zastanowić się nad empty hash examples (rozwiązanie: w ogóle nie szukać fraz o pustym hashu, rzucać wyjątek). + +DONE - wyłączyć stopWords DONE - Przy concordia searh dodatkowo obliczany ma być zestaw optymalnego pokrycia patternu. Może siłowo? (jeśli przyjąć max dł. zdania 500 tokenów, to nie powinno być źle)