pjn-2024-cw/03_NLP_linux.ipynb

147 lines
3.7 KiB
Plaintext
Raw Permalink Normal View History

2024-10-23 12:08:19 +02:00
{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Zajęcia 3: NLP w Linuxie\n",
"\n",
"W przypadku tych zajęć ćwiczeniowych, zadania należy rozwiązywać w Linuxie, natomiast komendy potrzebne do wykonania zadań proszę umieścić w tym Notebooku.\n",
"\n",
"Nie należy usuwać komórek z treścią zadań.\n",
"\n",
2024-10-23 16:51:53 +02:00
"W zadaniach 1-5 trzeba skorzystać z pliku \"names.txt\" (zawierającym imiona w języku polskim) w folderze Data\n"
2024-10-23 12:08:19 +02:00
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Zadanie 1\n",
"Napisz polecenie, które posortuje alfabetycznie i wyświetli na wyjściu imiona z pliku names.txt (nie przejmujemy się polskimi znakami)"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": [
"# Solution 1"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Zadanie 2\n",
"Napisz polecenie, które posortuje imiona alfabetycznie w odwrotnej kolejności z pliku names.txt i zapisze je do pliku names_sort.txt (nie przejmujemy się polskimi znakami)"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": [
"# Solution 2"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Zadanie 3\n",
"Napisz polecenie, które wypisze linie z przedziału 10-20 włącznie (łącznie 11 linii) z pliku names.txt"
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [],
"source": [
"# Solution 3"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Zadanie 4\n",
"\n",
"Napisz polecenie, które zwróci liczbę imion kończących się na \"usz\" lub \"aw\" (czyli np. Tadeusz, lub Wiesław)"
]
},
{
"cell_type": "code",
"execution_count": 3,
"metadata": {},
"outputs": [],
"source": [
"# Solution 4"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Zadanie 5\n",
"Napisz polecenie, które zamieni wszystkie wystąpienia polskich liter na znak X"
]
},
{
"cell_type": "code",
"execution_count": 4,
"metadata": {},
"outputs": [],
"source": [
"# Solution 5"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Zadanie 6\n",
"\n",
"Masz dwie listy słów: positive-words.txt i negative-words.txt, które zawierają słowa często kojarzone odpowiednio z pozytywnym i negatywnym wydźwiękiem (eng. sentiment). \n",
"\n",
"Twoim zadaniem jest napisanie skryptu bash, który wyświetli ile jest słów z plików negative-words.txt positive-words.txt oraz, czy ogólny wydźwięk tekstu jest \"Pozytywny\", \"Negatywny\", czy \"Neutralny\", w zależności od liczby słów (pozytywny, jeżeli liczba słów z pliku positive-words.txt jest większa od liczby słów z pliku negative-words.txt, neutralny jeżeli liczba jest równa i negatywny, gdy liczba słów z pliku positive-worsd.txt jest mniejsza od liczby słów).\n",
"\n",
"Przetestuj to na tekstach z plików example_text_1.txt oraz example_text_2.txt"
]
},
{
"cell_type": "code",
"execution_count": 5,
"metadata": {},
"outputs": [],
"source": [
"# Solution 6"
]
}
],
"metadata": {
"kernelspec": {
"display_name": "base",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.11.5"
}
},
"nbformat": 4,
"nbformat_minor": 2
}