# Nasz obraz będzie dziedziczył z obrazu Ubuntu w wersji latest
FROM ubuntu:latest
# Instalujemy niezbędne zależności. Zwróć uwagę na flagę "-y" (assume yes)
RUN apt update && apt install -y figlet python3 python3-pip
# Instalacja pakietów Pythona za pomocą PIP
RUN pip3 install pandas kaggle torch sklearn
# Dodajemy nasz skrypt Pythona do obrazu Docker
COPY learning.ipynb /learning.ipynb
# Ustawiamy domyślną komendę do uruchomienia naszego skryptu Pythona
CMD ["python3", "/learning.ipynb"]

"## PyTorch train model"
"### Wczytanie niezbędnych bibliotek"
"import torch\n",
"from torch import nn\n",
"from import DataLoader, TensorDataset\n",
"import pandas as pd\n",
"from sklearn.preprocessing import LabelEncoder"
"### Wczytanie danych z pliku"
"data = pd.read_csv('../data/btc_train.csv')\n",
"data = pd.DataFrame(data)"
"### Przygotowanie danych\n",
"Powinienembył zrobić to w zadaniu 1"
"le = LabelEncoder()\n",
"data['date'] = le.fit_transform(data['date'])\n",
"data['hour'] = le.fit_transform(data['hour'])\n",
"data['Volume BTC'] = data['Volume BTC']/10\n",
"# Przekształć łańcuchy znaków na liczby aby zapobiec 'TypeError: can't convert np.ndarray of type numpy.object_.'\n",
"for col in data.columns:\n",
" data[col] = pd.to_numeric(data[col], errors='coerce')\n",
"# # Zamień brakujące wartości na 0 aby zapobiec 'IndexError: Target -9223372036854775808 is out of bounds.'\n",
"data = data.fillna(0)"
"### Przygotowanie inputs oraz targets"
"# Przekształć dane na tensory PyTorch\n",
"inputs = torch.tensor(data[['date', 'hour', 'Volume BTC']].values, dtype=torch.float32)\n",
"targets = torch.tensor(data['Volume USD'].values, dtype=torch.float32).view(-1, 1) # zmieniono z torch.float32 na torch.long aby zapobiec RuntimeError: expected scalar type Long but found Float\n",
"### Utwórz DataLoader"
"data_set = TensorDataset(inputs, targets)\n",
"data_loader = DataLoader(data_set, batch_size=64)"
"### Model"
"model = nn.Sequential(\n",
" nn.Flatten(),\n",
" nn.Linear(inputs.shape[1], 64),\n",
" nn.ReLU(),\n",
" nn.Linear(64, 1),\n",
"### Funkcja straty i optymalizator"
"loss_fn = nn.MSELoss()\n",
"optimizer = torch.optim.SGD(model.parameters(), lr=1e-3)\n"
"### Trenowanie modelu"
"for epoch in range(10):\n",
" for X, y in data_loader:\n",
" pred = model(X)\n",
" loss = loss_fn(pred, y)\n",
" optimizer.zero_grad()\n",
" loss.backward()\n",
" optimizer.step()\n",
"print(\"Model został wytrenowany.\")"
"### Zapis modelu do pliku"
"## PyTorch train model"
"### Wczytanie niezbędnych bibliotek"
"import pandas as pd\n",
"import torch\n",
"from torch import nn\n",
"from sklearn.preprocessing import LabelEncoder"
"### Wczytanie danych z pliku"
"data = pd.read_csv('../data/btc_test.csv')\n",
"data = pd.DataFrame(data)"
"### Przygotowanie danych\n",
"Powinienembył zrobić to w zadaniu 1"
"le = LabelEncoder()\n",
"data['date'] = le.fit_transform(data['date'])\n",
"data['hour'] = le.fit_transform(data['hour'])\n",
"data['Volume BTC'] = data['Volume BTC']/10\n",
"# Przekształć łańcuchy znaków na liczby aby zapobiec 'TypeError: can't convert np.ndarray of type numpy.object_.'\n",
"for col in data.columns:\n",
" data[col] = pd.to_numeric(data[col], errors='coerce')\n",
"# Zamień brakujące wartości na 0 aby zapobiec 'IndexError: Target -9223372036854775808 is out of bounds.'\n",
"data = data.fillna(0)"
"### Przygotowanie inputs oraz targets"
"# Przekształć dane na tensory PyTorch\n",
"inputs = torch.tensor(data[['date', 'hour', 'Volume BTC']].values, dtype=torch.float32)"
"cell_type": "markdown",
"### Model"
"model = nn.Sequential(\n",
" nn.Flatten(),\n",
" nn.Linear(inputs.shape[1], 64),\n",
" nn.ReLU(),\n",
" nn.Linear(64, 1),\n",
"### Wczytanie wytrenowanego modelu"
"### Predykcja modelu"
"predictions = model(inputs)\n",
"predicted_data = (predictions.float() * 10)\n",
"cell_type": "code",
