From c718e197d624b0f94136920a8fd8cff319dbf8d2 Mon Sep 17 00:00:00 2001 From: s442188 Date: Sun, 3 Jun 2018 11:22:04 +0200 Subject: [PATCH] tasks --- labs06/tasks.py | 40 +++++++++++++++++++++++++++++++++------- 1 file changed, 33 insertions(+), 7 deletions(-) diff --git a/labs06/tasks.py b/labs06/tasks.py index 8b2c28e..7bf2125 100755 --- a/labs06/tasks.py +++ b/labs06/tasks.py @@ -5,76 +5,102 @@ 1. Zaimportuj bibliotkę pandas jako pd. """ +import pandas as pd """ 2. Wczytaj zbiór danych `311.csv` do zniennej data. """ +data = pd.read_csv("J:/PycharmProjects/Python2018/labs06/311.csv", low_memory = False) + """ 3. Wyświetl 5 pierwszych wierszy z data. """ +# print(data.head()) + """ 4. Wyświetl nazwy kolumn. """ +# print(data.info()) +#print(data.columns) """ 5. Wyświetl ile nasz zbiór danych ma kolumn i wierszy. -""" +""" +#shape = data.shape +#rows = shape[0] +#cols = shape[1] + +#print(rows, cols) """ 6. Wyświetl kolumnę 'City' z powyższego zbioru danych. """ +#print(data['City']) """ 7. Wyświetl jakie wartoścu przyjmuje kolumna 'City'. + """ +#print(data.City.unique()) """ 8. Wyświetl tabelę rozstawną kolumny City. """ - +#print(data.City.value_counts()) """ 9. Wyświetl tylko pierwsze 4 wiersze z wcześniejszego polecenia. """ - +#print(data.City.value_counts().head(4)) """ 10. Wyświetl, w ilu przypadkach kolumna City zawiera NaN. """ +#print(data[data['City'] == 'isnull']) """ 11. Wyświetl data.info() """ - +#print(data.info()) """ 12. Wyświetl tylko kolumny Borough i Agency i tylko 5 ostatnich linii. """ +#print(data[['Borough', 'Agency']].tail(5)) """ 13. Wyświetl tylko te dane, dla których wartość z kolumny Agency jest równa NYPD. Zlicz ile jest takich przykładów. + """ +#print(data[data['Agency'] == 'NYPD']) """ 14. Wyświetl wartość minimalną i maksymalną z kolumny Longitude. """ - +#wartosc = data['Longitude'] +#print(wartosc.max()) +#print(wartosc.min()) """ 15. Dodaj kolumne diff, która powstanie przez sumowanie kolumn Longitude i Latitude. """ - - +x=data['Longitude'] +y=data['Latitude'] +data['diff'] = x+y +print(data['diff']) """ 16. Wyświetl tablę rozstawną dla kolumny 'Descriptor', dla której Agency jest równe NYPD. """ + +p = data[data['Agency'] == 'NYPD'] +p.Descriptor.value_counts() \ No newline at end of file