diff --git a/create-dataset.sh b/create-dataset.sh index 8e1895b..8608fed 100644 --- a/create-dataset.sh +++ b/create-dataset.sh @@ -8,7 +8,7 @@ unzip airbnb-prices-in-european-cities.zip -d data rm airbnb-prices-in-european-cities.zip head -n $CUTOFF data/barcelona_weekends.csv | shuf > data/barcelona_weekends.shuf.csv -head -n $CUTOFF/4 data/barcelona_weekends.shuf.csv > data/barcelona_weekends.test.csv -head -n $CUTOFF/2 data/barcelona_weekends.shuf.csv | tail -n 25 > data/barcelona_weekends.dev.csv -tail -n $CUTOFF/2+1 data/barcelona_weekends.shuf.csv > data/barcelona_weekends.train.csv +head -n $(($CUTOFF/4)) data/barcelona_weekends.shuf.csv > data/barcelona_weekends.test.csv +head -n $(($CUTOFF/2)) data/barcelona_weekends.shuf.csv | tail -n 25 > data/barcelona_weekends.dev.csv +tail -n $(($CUTOFF/2+1)) data/barcelona_weekends.shuf.csv > data/barcelona_weekends.train.csv rm data/barcelona_weekends.shuf.csv