Update 'script.sh'

This commit is contained in:
Marcin Rostkowski 2023-04-19 19:59:47 +02:00
parent 343a3e9daa
commit d2c655b914

View File

@ -1,20 +1,17 @@
#!/bin/bash
# Pobierz zbiór danych
kaggle datasets download -d iabhishekofficial/mobile-price-classification --force
set -e
# Wypakuj pobrany zbiór danych
# Uwierzytelnianie w Kaggle API za pomocą zmiennych środowiskowych
export KAGGLE_USERNAME=$KAGGLE_USERNAME
export KAGGLE_KEY=$KAGGLE_KEY
# Pobieranie i rozpakowywanie danych
kaggle datasets download -d iabhishekofficial/mobile-price-classification
unzip -o mobile-price-classification.zip
# Przetwórz dane
INPUT_FILE="train.csv"
OUTPUT_FILE="output.txt"
# Przetwarzanie danych
cut -f $CUT --complement -d, train.csv > waterQuality.csv
# Symulacja przetwarzania pliku - wybierz pierwszych 100 wierszy
head -n 100 "$INPUT_FILE" > "$OUTPUT_FILE"
# Usuń kolumny o indeksach 1, 3 i 4
cut -f 1,3,4 --complement -d "," -s "$OUTPUT_FILE" > tmp.txt && mv tmp.txt "$OUTPUT_FILE"
# Archiwizuj wynikowe dane
gzip -f "$OUTPUT_FILE"
# Kompresowanie pliku wynikowego
gzip -c waterQuality.csv > output.txt.gz