1. lokalizowane to_lower (wykorzystać utf8case, naprawić testy) 2. anonimizacja zdań 3. Dzielenie zdań (max 255 tokenów) 4. concordia-server