1. lokalizowane to_lower 2. anonimizacja zdań 3. Dzielenie zdań (max 255 tokenów)