From 9420133937c13bfcdab84bcc45d77df2e63b2a00 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Pawe=C5=82=20Sk=C3=B3rzewski?= Date: Thu, 24 Mar 2022 12:05:36 +0100 Subject: [PATCH] Jeszcze drobne poprawki do lab. 4 --- lab/04_scikit-learn.ipynb | 35 +---------------------------------- 1 file changed, 1 insertion(+), 34 deletions(-) diff --git a/lab/04_scikit-learn.ipynb b/lab/04_scikit-learn.ipynb index 60fb7f0..0e32d0f 100644 --- a/lab/04_scikit-learn.ipynb +++ b/lab/04_scikit-learn.ipynb @@ -29,39 +29,6 @@ "Na podobnej zasadzie można korzystać z innych modeli dostępnych w bibliotece." ] }, - { - "cell_type": "code", - "execution_count": 12, - "metadata": {}, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "0 Polecam mieszkanie 2 pokojowe o metrażu 46,68...\n", - "1 Ekskluzywna oferta - tylko u nas! Projekt arc...\n", - "2 Polecam do kupna przestronne mieszkanie trzyp...\n", - "3 Dla rodziny albo pod wynajem. Świetna lokaliz...\n", - "4 NaN\n", - " ... \n", - "4933 Trzypokojowe mieszkanie do generalnego remont...\n", - "4934 OKAZJA!! LUKSUSOWY APARTAMENT W SĄSIEDZTWIE P...\n", - "4935 Jest to oferta nieruchomości z rynku pierwotn...\n", - "4936 Mam do sprzedania dom mieszkalny, jednorodzin...\n", - "4937 Sprzedaż nowego mieszkania w FAŁKOWIE - Osied...\n", - "Name: opis, Length: 4938, dtype: object\n" - ] - } - ], - "source": [ - "dataset_filename = 'flats.tsv'\n", - "data = pd.read_csv(dataset_filename, header=0, sep='\\t')\n", - "\n", - "print(data['opis'])\n", - "\n", - "data['ładne w opisie'] = data['opis'].apply(lambda x: True if 'ładne' in str(x) else False)" - ] - }, { "cell_type": "code", "execution_count": 15, @@ -122,7 +89,7 @@ " lambda x: True if 'ładne' in str(x) else False)\n", "\n", "data = data[FEATURES + ['cena']] # wybór cech\n", - "data = data[(data[\"Powierzchnia w m2\"] < 10000) & (data[\"cena\"] > 10000)]\n", + "data = data[(data[\"Powierzchnia w m2\"] < 10000) & (data[\"cena\"] > 1000)] # Odrzucenie obserwacji odstających\n", "data = preprocess(data) # wstępne przetworzenie danych\n", "\n", "# Podział danych na zbiory uczący i testowy\n",