Jeszcze drobne poprawki do lab. 4

This commit is contained in:
Paweł Skórzewski 2022-03-24 12:05:36 +01:00
parent a847c25479
commit 9420133937

View File

@ -29,39 +29,6 @@
"Na podobnej zasadzie można korzystać z innych modeli dostępnych w bibliotece."
]
},
{
"cell_type": "code",
"execution_count": 12,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"0 Polecam mieszkanie 2 pokojowe o metrażu 46,68...\n",
"1 Ekskluzywna oferta - tylko u nas! Projekt arc...\n",
"2 Polecam do kupna przestronne mieszkanie trzyp...\n",
"3 Dla rodziny albo pod wynajem. Świetna lokaliz...\n",
"4 NaN\n",
" ... \n",
"4933 Trzypokojowe mieszkanie do generalnego remont...\n",
"4934 OKAZJA!! LUKSUSOWY APARTAMENT W SĄSIEDZTWIE P...\n",
"4935 Jest to oferta nieruchomości z rynku pierwotn...\n",
"4936 Mam do sprzedania dom mieszkalny, jednorodzin...\n",
"4937 Sprzedaż nowego mieszkania w FAŁKOWIE - Osied...\n",
"Name: opis, Length: 4938, dtype: object\n"
]
}
],
"source": [
"dataset_filename = 'flats.tsv'\n",
"data = pd.read_csv(dataset_filename, header=0, sep='\\t')\n",
"\n",
"print(data['opis'])\n",
"\n",
"data['ładne w opisie'] = data['opis'].apply(lambda x: True if 'ładne' in str(x) else False)"
]
},
{
"cell_type": "code",
"execution_count": 15,
@ -122,7 +89,7 @@
" lambda x: True if 'ładne' in str(x) else False)\n",
"\n",
"data = data[FEATURES + ['cena']] # wybór cech\n",
"data = data[(data[\"Powierzchnia w m2\"] < 10000) & (data[\"cena\"] > 10000)]\n",
"data = data[(data[\"Powierzchnia w m2\"] < 10000) & (data[\"cena\"] > 1000)] # Odrzucenie obserwacji odstających\n",
"data = preprocess(data) # wstępne przetworzenie danych\n",
"\n",
"# Podział danych na zbiory uczący i testowy\n",