Python2018/labs06/tasks.py

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

"""
1. Zaimportuj bibliotkę pandas jako pd.
"""
import pandas as pd

"""
2. Wczytaj zbiór danych `311.csv` do zniennej data.
"""
data = pd.read_csv("J:/PycharmProjects/Python2018/labs06/311.csv", low_memory=False)


"""
3. Wyświetl 5 pierwszych wierszy z data.
"""
#print(data.head())

"""
4. Wyświetl nazwy kolumn.
"""
#print(data.columns)

"""
5. Wyświetl ile nasz zbiór danych ma kolumn i wierszy.
"""
#print(data.shape)

"""
6. Wyświetl kolumnę 'City' z powyższego zbioru danych.
"""
#print(data['City'])

"""
7. Wyświetl jakie wartoścu przyjmuje kolumna 'City'.
"""
#print(data['City'].unique())

"""
8. Wyświetl tabelę rozstawną kolumny City.
"""
#print(data['City'].value_counts())

"""
9. Wyświetl tylko pierwsze 4 wiersze z wcześniejszego polecenia.
"""
#data2 = pd.DataFrame(data['City'].value_counts())
#print(data2.info())
#print(data2.head())

"""
10. Wyświetl, w ilu przypadkach kolumna City zawiera NaN.
"""
#print(data[data['City'].isnull()].shape[0])


"""
11. Wyświetl data.info()
"""
#data.info()

"""
12. Wyświetl tylko kolumny Borough i Agency i tylko 5 ostatnich linii.
"""
#print(data[['Borough', 'Agency']].tail())

"""
13. Wyświetl tylko te dane, dla których wartość z kolumny Agency jest równa
NYPD. Zlicz ile jest takich przykładów.
"""
#print(data[data['Agency']=='NYPD'].shape[0])

"""
14. Wyświetl wartość minimalną i maksymalną z kolumny Longitude.
"""
#print(data['Longitude'].min())
#print(data['Longitude'].max())

"""
15. Dodaj kolumne diff, która powstanie przez sumowanie kolumn Longitude i Latitude.
"""
#data['diff'] = data['Longitude']+data['Latitude']
#print(data[-3:].head())

"""
16. Wyświetl tablę rozstawną dla kolumny 'Descriptor', dla której Agency jest
równe NYPD.
"""
#print(data[data['Agency']=='NYPD']['Descriptor'].value_counts())
add tasks.py 2018-06-03 08:10:07 +02:00			`#!/usr/bin/env python3`
			`# -- coding: utf-8 --`

			`"""`
			`1. Zaimportuj bibliotkę pandas jako pd.`
			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`import pandas as pd`
add tasks.py 2018-06-03 08:10:07 +02:00
			`"""`
Add 311 2018-06-03 09:52:00 +02:00			2. Wczytaj zbiór danych `311.csv` do zniennej data.
add tasks.py 2018-06-03 08:10:07 +02:00			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`data = pd.read_csv("J:/PycharmProjects/Python2018/labs06/311.csv", low_memory=False)`
add tasks.py 2018-06-03 08:10:07 +02:00

			`"""`
			`3. Wyświetl 5 pierwszych wierszy z data.`
			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`#print(data.head())`
add tasks.py 2018-06-03 08:10:07 +02:00
			`"""`
			`4. Wyświetl nazwy kolumn.`
			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`#print(data.columns)`
add tasks.py 2018-06-03 08:10:07 +02:00
			`"""`
			`5. Wyświetl ile nasz zbiór danych ma kolumn i wierszy.`
			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`#print(data.shape)`
add tasks.py 2018-06-03 08:10:07 +02:00
			`"""`
			`6. Wyświetl kolumnę 'City' z powyższego zbioru danych.`
			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`#print(data['City'])`
add tasks.py 2018-06-03 08:10:07 +02:00
			`"""`
			`7. Wyświetl jakie wartoścu przyjmuje kolumna 'City'.`
			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`#print(data['City'].unique())`
add tasks.py 2018-06-03 08:10:07 +02:00
			`"""`
			`8. Wyświetl tabelę rozstawną kolumny City.`
			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`#print(data['City'].value_counts())`
add tasks.py 2018-06-03 08:10:07 +02:00
			`"""`
			`9. Wyświetl tylko pierwsze 4 wiersze z wcześniejszego polecenia.`
			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`#data2 = pd.DataFrame(data['City'].value_counts())`
			`#print(data2.info())`
			`#print(data2.head())`
add tasks.py 2018-06-03 08:10:07 +02:00
			`"""`
			`10. Wyświetl, w ilu przypadkach kolumna City zawiera NaN.`
			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`#print(data[data['City'].isnull()].shape[0])`
add tasks.py 2018-06-03 08:10:07 +02:00

			`"""`
			`11. Wyświetl data.info()`
			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`#data.info()`
add tasks.py 2018-06-03 08:10:07 +02:00
			`"""`
			`12. Wyświetl tylko kolumny Borough i Agency i tylko 5 ostatnich linii.`
			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`#print(data[['Borough', 'Agency']].tail())`
add tasks.py 2018-06-03 08:10:07 +02:00
			`"""`
			`13. Wyświetl tylko te dane, dla których wartość z kolumny Agency jest równa`
			`NYPD. Zlicz ile jest takich przykładów.`
			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`#print(data[data['Agency']=='NYPD'].shape[0])`
add tasks.py 2018-06-03 08:10:07 +02:00
			`"""`
			`14. Wyświetl wartość minimalną i maksymalną z kolumny Longitude.`
			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`#print(data['Longitude'].min())`
			`#print(data['Longitude'].max())`
add tasks.py 2018-06-03 08:10:07 +02:00
			`"""`
			`15. Dodaj kolumne diff, która powstanie przez sumowanie kolumn Longitude i Latitude.`
			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`#data['diff'] = data['Longitude']+data['Latitude']`
			`#print(data[-3:].head())`
add tasks.py 2018-06-03 08:10:07 +02:00
			`"""`
			`16. Wyświetl tablę rozstawną dla kolumny 'Descriptor', dla której Agency jest`
			`równe NYPD.`
			`"""`
laboratoria4 2018-06-03 11:15:04 +02:00			`#print(data[data['Agency']=='NYPD']['Descriptor'].value_counts())`