diff --git a/create-dataset.sh b/create-dataset.sh index 8608fed..3201082 100644 --- a/create-dataset.sh +++ b/create-dataset.sh @@ -8,7 +8,7 @@ unzip airbnb-prices-in-european-cities.zip -d data rm airbnb-prices-in-european-cities.zip head -n $CUTOFF data/barcelona_weekends.csv | shuf > data/barcelona_weekends.shuf.csv -head -n $(($CUTOFF/4)) data/barcelona_weekends.shuf.csv > data/barcelona_weekends.test.csv -head -n $(($CUTOFF/2)) data/barcelona_weekends.shuf.csv | tail -n 25 > data/barcelona_weekends.dev.csv -tail -n $(($CUTOFF/2+1)) data/barcelona_weekends.shuf.csv > data/barcelona_weekends.train.csv +head -n 25 data/barcelona_weekends.shuf.csv > data/barcelona_weekends.test.csv +head -n 50 data/barcelona_weekends.shuf.csv | tail -n 25 > data/barcelona_weekends.dev.csv +tail -n +51 data/barcelona_weekends.shuf.csv > data/barcelona_weekends.train.csv rm data/barcelona_weekends.shuf.csv