diff --git a/02_wyrazenia_regularne.ipynb b/02_wyrazenia_regularne.ipynb index dae36b9..2f9b661 100644 --- a/02_wyrazenia_regularne.ipynb +++ b/02_wyrazenia_regularne.ipynb @@ -38,15 +38,6 @@ "* Funkcja walidująca adres email (uproszczone założenia: pierwsza część składa się z liter i cyfr, potem mamy symbol \"@\", następnie domenę składającą się z liter, dalej symbol \".\" i na końcu ciąg liter od 2 do 6 znaków)" ] }, - { - "cell_type": "code", - "execution_count": 10, - "metadata": {}, - "outputs": [], - "source": [ - "import re" - ] - }, { "cell_type": "code", "execution_count": null, @@ -71,7 +62,7 @@ " pass\n", "\n", "\n", - "names = [\"Adam\", \"Ewa\", \"adam\", \"maciek15pl\", \"y\", \"ka$ia\"]\n", + "names = [\"Adam\", \"Ewa\", \"adam\", \"maciek15pl\", \"y\", \"ka$ia\", \"Adam to szef\", \"adam To szef\"]\n", "phone_numbers = [\"(61) 222-45-56\", \"telefon: (61) 222-45-56\", \"23 123-25-64\", \"(61) 5312-53-1\", \"(00 1110022)\"]\n", "zip_codes = [\"61-620\", \"63-125 \", \"12345\", \"125-21\"]\n", "emails = [\"sigmaboy@sigma.pl\", \"superbohater2008@gmail.com\", \"bieg@cz@gmail.com\", \".slodkipiesek.@pieskowo.eu\", \"@do.it\"]\n", @@ -119,7 +110,9 @@ "metadata": {}, "source": [ "### Zadanie 3\n", - "Napisz funkcję, który znajdzie w tekście jak największą liczbę wulgaryzmów i zastąpi je ciągiem znaków \"---\" (i zwróci tekst bez wulgaryzmów). Użyj wyrażeń regularnych. Pamiętaj, że wulgaryzmy odmieniają się przez przypadki oraz tworzy się z nich czasowniki, które również można uznać za wulgaryzmy. Przetestuj program na prawdziwym tekście (minimum 500 znaków) zawierającym różne wulgaryzmy (np. jakaś wypowiedź z forum internetowego)." + "Napisz funkcję, który znajdzie w tekście jak największą liczbę wulgaryzmów i zastąpi je ciągiem znaków \"---\" (i zwróci tekst bez wulgaryzmów). Użyj wyrażeń regularnych. Pamiętaj, że wulgaryzmy odmieniają się przez przypadki oraz tworzy się z nich czasowniki, które również można uznać za wulgaryzmy. Przetestuj program na prawdziwym tekście (minimum 500 znaków) zawierającym różne wulgaryzmy (np. jakaś wypowiedź z forum internetowego).\n", + "\n", + "Nie wolno stosować długiej listy słów odmienionych w różny sposób jako pattern, należy użyć relatywnie niedużej listy i zastosować odpowiedni pattern pokrywający różne odmiany danego słowa." ] }, { diff --git a/03_NLP_linux.ipynb b/03_NLP_linux.ipynb index ceaa229..5fde3de 100644 --- a/03_NLP_linux.ipynb +++ b/03_NLP_linux.ipynb @@ -10,7 +10,7 @@ "\n", "Nie należy usuwać komórek z treścią zadań.\n", "\n", - "W zadaniach trzeba skorzystać z pliku \"names.txt\" (zawierającym imiona w języku polskim) w folderze Data\n" + "W zadaniach 1-5 trzeba skorzystać z pliku \"names.txt\" (zawierającym imiona w języku polskim) w folderze Data\n" ] }, {