ium_478841/load_data.sh
2022-03-27 23:34:18 +02:00

13 lines
392 B
Bash

figlet "Welcome $KAGGLE_USERNAME"
rm -r avocado.data*
kaggle datasets download -d neuromusic/avocado-prices
unzip -o avocado-prices.zip
tail -n +2 avocado.csv | shuf > avocado_shuf.csv
head -n 14000 avocado_shuf.csv > avocado.data.train
tail -n +14001 avocado_shuf.csv | head -n 2249 > avocado.data.valid
tail -n 2000 avocado_shuf.csv > avocado.data.test
wc -l avocado.data* > results.txt