updated todo
This commit is contained in:
parent
7e005bfca7
commit
cf7b1592f7
7
TODO.txt
7
TODO.txt
@ -1,8 +1,7 @@
|
||||
---------------------------- Developer's private notes (language may vary, bo tak czasem wygodniej) -----------------------------
|
||||
- concordia helper - aplikacja windowsowa, która wyszukuje w Concordii zdanie zaznaczone w dowolnej aplikacji: https://www.jayway.com/2013/02/06/how-to-get-selected-text-from-another-windows-program/
|
||||
- document analysis - concordia score should be calculated for a document. Idea - for each fragment: (fragment length/document length) * log penalty at sentence level.
|
||||
- moving/extending concordia matches on demand - powered by concordia-server
|
||||
- rethink passing variables such as TokenizedSentence by smart pointers. Consider using references in getters.
|
||||
- multiple indexes based on different hashes. One can be word-net base forms, other - pos-tags and so on. Develop a method of combining results.
|
||||
- multiple indexes based on different hashes. One can be word-net base forms, other - pos-tags and so on. Develop a method of combining results. It may be a way to implement lemmatization.
|
||||
IN PROGRESS - document the code (classes, cfg files) and update tutorial
|
||||
- wiele pamięci tłumaczeń: można je przechowywać w jednym indeksie, ale trzeba dodać tm_id jako metadane zdania (np. zamiast example length). Przy wyszukiwaniu należy filtrować wyniki, aby pochodziły z odpowiedniej pamięci tłumaczeń.
|
||||
- Prawdopodobnie długość example w markers będzie potrzebna tylko anubisowi (który, jak się okazuje, jest wolny). Pomyśleć, do czego można wykorzystać markery, bo ich idea wydaje się niezła.
|
||||
@ -11,6 +10,8 @@ IN PROGRESS - document the code (classes, cfg files) and update tutorial
|
||||
|
||||
|
||||
---------------------------- Archive -----------------------------
|
||||
DONE - rethink passing variables such as TokenizedSentence by smart pointers. Consider using references in getters.
|
||||
DONE - moving/extending concordia matches on demand - powered by concordia-server
|
||||
DONE - testy zużycia pamięci
|
||||
DONE - change the arguments of addExample* fucntions to const reference to TokenizedSentence (not boost::shared_ptr<TokenizedSentence>
|
||||
DONE - concordia search zwraca pozycje tokenów z hash'a. Jak to odnieść do examples w korpusie? Należy przechowywać oryginalne pozycje tokenów w bazie danych concordia-server. Pozycje te będą obliczane przez funkcję generateTokenVector (przy użyciu listy oryginalnych pozycji, która będzie modyfikowana synchronicznie z każdą anonimizacją)
|
||||
|
Loading…
Reference in New Issue
Block a user