3.7 KiB
Zajęcia 3: NLP w Linuxie
W przypadku tych zajęć ćwiczeniowych, zadania należy rozwiązywać w Linuxie, natomiast komendy potrzebne do wykonania zadań proszę umieścić w tym Notebooku.
Nie należy usuwać komórek z treścią zadań.
W zadaniach 1-5 trzeba skorzystać z pliku "names.txt" (zawierającym imiona w języku polskim) w folderze Data
Zadanie 1
Napisz polecenie, które posortuje alfabetycznie i wyświetli na wyjściu imiona z pliku names.txt (nie przejmujemy się polskimi znakami)
# Solution 1
Zadanie 2
Napisz polecenie, które posortuje imiona alfabetycznie w odwrotnej kolejności z pliku names.txt i zapisze je do pliku names_sort.txt (nie przejmujemy się polskimi znakami)
# Solution 2
Zadanie 3
Napisz polecenie, które wypisze linie z przedziału 10-20 włącznie (łącznie 11 linii) z pliku names.txt
# Solution 3
Zadanie 4
Napisz polecenie, które zwróci liczbę imion kończących się na "usz" lub "aw" (czyli np. Tadeusz, lub Wiesław)
# Solution 4
Zadanie 5
Napisz polecenie, które zamieni wszystkie wystąpienia polskich liter na znak X
# Solution 5
Zadanie 6
Masz dwie listy słów: positive-words.txt i negative-words.txt, które zawierają słowa często kojarzone odpowiednio z pozytywnym i negatywnym wydźwiękiem (eng. sentiment).
Twoim zadaniem jest napisanie skryptu bash, który wyświetli ile jest słów z plików negative-words.txt positive-words.txt oraz, czy ogólny wydźwięk tekstu jest "Pozytywny", "Negatywny", czy "Neutralny", w zależności od liczby słów (pozytywny, jeżeli liczba słów z pliku positive-words.txt jest większa od liczby słów z pliku negative-words.txt, neutralny jeżeli liczba jest równa i negatywny, gdy liczba słów z pliku positive-worsd.txt jest mniejsza od liczby słów).
Przetestuj to na tekstach z plików example_text_1.txt oraz example_text_2.txt
# Solution 6