1. lokalizowane to_lower (wykorzystać utf8case, naprawić testy)
2. anonimizacja zdań
3. Dzielenie zdań (max 255 tokenów)
4. concordia-server