Add mlflow

2024-05-16 03:01:35 +02:00 · 2024-05-16 03:01:35 +02:00 · 4be943832b
commit 4be943832b
parent cade934db3
7 changed files with 50 additions and 6 deletions
--- a/2
+++ b/2
@ -2,7 +2,7 @@ FROM ubuntu:latest

 RUN apt-get update && \
    apt-get install -y python3-pip && \
-    pip3 install kaggle pandas scikit-learn tensorflow matplotlib
+    pip3 install kaggle pandas scikit-learn tensorflow matplotlib mlflow

 RUN useradd -ms /bin/bash jenkins

--- a/2
+++ b/2
@ -1,6 +1,6 @@
 pipeline {
    agent {
-        docker { image 'paweldopierala/ium:1.0.0' }
+        docker { image 'paweldopierala/ium:2.0.0' }
    }

    parameters{
--- a/12
+++ b/12
@ -14,6 +14,16 @@ pipeline {
            description: 'Epochs',
            name: 'EPOCHS'
        )
+        string(
+            defaultValue: '0.001',
+            description: 'Learning Rate',
+            name: 'LEARNING_RATE'
+        )
+        string(
+            defaultValue: '32',
+            description: 'Batch size',
+            name: 'BATCH_SIZE'
+        )
    }

    triggers {
@ -37,7 +47,7 @@ pipeline {
        stage('Script') {
            steps {
                sh 'chmod 777 ./create_model.py'
-                sh "python3 ./create_model.py ${params.EPOCHS}"
+                sh "python3 ./create_model.py ${params.EPOCHS} ${params.LEARNING_RATE} ${params.BATCH_SIZE}"
            }
        }
        stage('CreateArtifacts') {
--- a/15
+++ b/15
@ -0,0 +1,15 @@
+name: HousePriceModel
+
+docker_env:
+  image: paweldopierala/ium:2.0.0
+
+entry_points:
+  main:
+    parameters:
+      epochs: {type: int, default: 20}
+      learning_rate: {type: float, default: 0.001}
+      batch_size: {type: int, default: 20}
+    command: "python train.py {epochs} {learning_rate} {batch_size}"
+
+  test:
+    command: "python test.py"
--- a/Readme.md
+++ b/Readme.md
@ -0,0 +1 @@
+```python -m mlflow run .```
--- a/create_model.py
+++ b/create_model.py
@ -4,10 +4,13 @@ from keras.models import Sequential
 from keras.layers import Dense
 from keras.optimizers import Adam
 from keras import regularizers
+import mlflow

 from helper import prepare_tensors

 epochs = int(sys.argv[1])
+learning_rate = float(sys.argv[2])
+batch_size = int(sys.argv[3])

 hp_train = pd.read_csv('hp_train.csv')
 hp_dev = pd.read_csv('hp_dev.csv')
@ -22,9 +25,14 @@ model.add(Dense(16, activation='relu', kernel_regularizer=regularizers.l2(0.01))
 model.add(Dense(8, activation='relu', kernel_regularizer=regularizers.l2(0.01)))
 model.add(Dense(1, activation='linear'))

-adam = Adam(learning_rate=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-7)
+adam = Adam(learning_rate=learning_rate, beta_1=0.9, beta_2=0.999, epsilon=1e-7)
 model.compile(optimizer=adam, loss='mean_squared_error')

-model.fit(X_train, Y_train, epochs=epochs, batch_size=32, validation_data=(X_dev, Y_dev))
+model.fit(X_train, Y_train, epochs=epochs, batch_size=batch_size, validation_data=(X_dev, Y_dev))

 model.save('hp_model.h5')
+
+with mlflow.start_run() as run:
+    mlflow.log_param("epochs", epochs)
+    mlflow.log_param("learning_rate", learning_rate)
+    mlflow.log_param("batch_size", batch_size)
--- a/evaluate.py
+++ b/evaluate.py
@ -2,12 +2,17 @@ import pandas as pd
 import numpy as np
 import sys
 import os
+
+import mlflow
 from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
 from keras.models import load_model
 from helper import prepare_tensors
 import matplotlib.pyplot as plt

-build_number = int(sys.argv[1])
+if len(sys.argv) > 1:
+    build_number = int(sys.argv[1])
+else:
+    build_number = 0

 hp_test = pd.read_csv('hp_test.csv')
 X_test, Y_test = prepare_tensors(hp_test)
@ -49,3 +54,8 @@ for metric in metrics:
    plot_file = f'plot_{metric.lower()}.png'
    plt.savefig(plot_file)
    plt.close()
+
+with mlflow.start_run() as run:
+    mlflow.log_metric('RMSE', rmse)
+    mlflow.log_metric('MAE', mae)
+    mlflow.log_metric('R2', r2)