pjn-2024-cw/03_NLP_linux.ipynb
2024-10-23 16:51:53 +02:00

3.7 KiB

Zajęcia 3: NLP w Linuxie

W przypadku tych zajęć ćwiczeniowych, zadania należy rozwiązywać w Linuxie, natomiast komendy potrzebne do wykonania zadań proszę umieścić w tym Notebooku.

Nie należy usuwać komórek z treścią zadań.

W zadaniach 1-5 trzeba skorzystać z pliku "names.txt" (zawierającym imiona w języku polskim) w folderze Data

Zadanie 1

Napisz polecenie, które posortuje alfabetycznie i wyświetli na wyjściu imiona z pliku names.txt (nie przejmujemy się polskimi znakami)

# Solution 1

Zadanie 2

Napisz polecenie, które posortuje imiona alfabetycznie w odwrotnej kolejności z pliku names.txt i zapisze je do pliku names_sort.txt (nie przejmujemy się polskimi znakami)

# Solution 2

Zadanie 3

Napisz polecenie, które wypisze linie z przedziału 10-20 włącznie (łącznie 11 linii) z pliku names.txt

# Solution 3

Zadanie 4

Napisz polecenie, które zwróci liczbę imion kończących się na "usz" lub "aw" (czyli np. Tadeusz, lub Wiesław)

# Solution 4

Zadanie 5

Napisz polecenie, które zamieni wszystkie wystąpienia polskich liter na znak X

# Solution 5

Zadanie 6

Masz dwie listy słów: positive-words.txt i negative-words.txt, które zawierają słowa często kojarzone odpowiednio z pozytywnym i negatywnym wydźwiękiem (eng. sentiment).

Twoim zadaniem jest napisanie skryptu bash, który wyświetli ile jest słów z plików negative-words.txt positive-words.txt oraz, czy ogólny wydźwięk tekstu jest "Pozytywny", "Negatywny", czy "Neutralny", w zależności od liczby słów (pozytywny, jeżeli liczba słów z pliku positive-words.txt jest większa od liczby słów z pliku negative-words.txt, neutralny jeżeli liczba jest równa i negatywny, gdy liczba słów z pliku positive-worsd.txt jest mniejsza od liczby słów).

Przetestuj to na tekstach z plików example_text_1.txt oraz example_text_2.txt

# Solution 6