#!/usr/bin/env python3 # -*- coding: utf-8 -*- """ 1. Zaimportuj bibliotkę pandas jako pd. """ import pandas as pd """ 2. Wczytaj zbiór danych `311.csv` do zniennej data. """ data = pd.read_csv('311.csv', low_memory=False) """ 3. Wyświetl 5 pierwszych wierszy z data. """ print(data.head()) """ 4. Wyświetl nazwy kolumn. """ print(data.columns.values) """ 5. Wyświetl ile nasz zbiór danych ma kolumn i wierszy. """ print('Rows: ' + str(data.shape[0]) + '\nColumns: ' + str(data.shape[1])) """ 6. Wyświetl kolumnę 'City' z powyższego zbioru danych. """ print(data.City) """ 7. Wyświetl jakie wartoścu przyjmuje kolumna 'City'. """ print(data.City.unique()) """ 8. Wyświetl tabelę rozstawną kolumny City. """ print(data.City.value_counts()) """ 9. Wyświetl tylko pierwsze 4 wiersze z wcześniejszego polecenia. """ print(data.City.value_counts().head(4)) """ 10. Wyświetl, w ilu przypadkach kolumna City zawiera NaN. """ print(len(data[data.City.isnull()])) """ 11. Wyświetl data.info() """ print(data.info()) """ 12. Wyświetl tylko kolumny Borough i Agency i tylko 5 ostatnich linii. """ print(data[['Borough', 'Agency']].tail()) """ 13. Wyświetl tylko te dane, dla których wartość z kolumny Agency jest równa NYPD. Zlicz ile jest takich przykładów. """ print(data[data.Agency == 'NYPD']) """ 14. Wyświetl wartość minimalną i maksymalną z kolumny Longitude. """ print('Min: ' + str(data.Longitude.min())) print('Max: ' + str(data.Longitude.max())) """ 15. Dodaj kolumne diff, która powstanie przez sumowanie kolumn Longitude i Latitude. """ data['diff'] = data.Longitude + data.Latitude """ 16. Wyświetl tablę rozstawną dla kolumny 'Descriptor', dla której Agency jest równe NYPD. """ print(data.Descriptor[data.Agency == 'NYPD'].value_counts())