mieszkania5/linear_regression.ipynb
2020-12-19 23:18:45 +01:00

5.6 KiB

import numpy as np
import pandas as pd
import torch
import torch.nn as tnn
filedir = '/home/ubuntu/Pulpit/TAU/mieszkania5'

#train size
learningRate = 0.000001 #przy obecnie ustawinej wartości udało się uzyskać najlepszy wynik. Najniższa wartość przy której tensory wyściowe regresji (zmienna outputs w sekcji trening) nie są [nan] wynisu 0.00001
epochs = 20000

#treainfile
trainfile = filedir + '/train/train.tsv'

#data files
dev0in = filedir + '/dev-0/in.tsv'
dev0out = filedir + '/dev-0/out.tsv' 
testAin = filedir + '/test-A/in.tsv'
testAout = filedir + '/test-A/out.tsv'
class linearRegression(tnn.Module):
    def __init__(self, dim_i, dim_o):
        super(linearRegression, self).__init__()
        self.linear = tnn.Linear(dim_i, dim_o)

    def forward(self, x):
        out = self.linear(x)
        return out

model = linearRegression(1, 1)
device = torch.device('cpu')
model.to(device)
criterion = tnn.MSELoss() 
optimizer = torch.optim.SGD(model.parameters(), lr=learningRate)

print('model regresji gotowy')
model regresji gotowy
#dane do treningu
trainfile_read = pd.read_csv(trainfile, sep='\t', header=None, index_col=None)
train_data_sizes = np.array(trainfile_read[8].tolist(), dtype=np.float32).reshape(-1, 1)
train_data_prices = np.array(trainfile_read[0].tolist(), dtype=np.float32).reshape(-1, 1)

print("dane treningowe wczytane")
dane treningowe wczytane
#trening
for epoch in range(epochs):
    inputs = torch.from_numpy(train_data_sizes).to(device)
    labels = torch.from_numpy(train_data_prices).to(device)
    
    optimizer.zero_grad()

    outputs = model(inputs)

    loss = criterion(outputs, labels)

    loss.backward()

    optimizer.step()

print('trening zakonczony')
trening zakonczony
#dane do przewidywania
devfile_read = pd.read_csv(dev0in, sep='\t', header=None, index_col=None)
testfile_in = pd.read_csv(testAin, sep='\t', header=None, index_col=None)
dev_data_sizes = np.array(devfile_read[7].tolist(), dtype=np.float32).reshape(-1, 1)
test_data_sizes = np.array(testfile_in[7].tolist(), dtype=np.float32).reshape(-1, 1)

print('dane do przewidzenia wczytane')
dane do przewidzenia wczytane
#przewidywanie ceny dev-0
pred_data = model(torch.from_numpy(dev_data_sizes).requires_grad_()).data.numpy()

print('zapisywanie wyników dev-0')

dev_of = open(dev0out, 'w')
for i in pred_data:
    dev_of.write(str(i[0])+'\n')
dev_of.close()

print('wyniki zapisane')
zapisywanie wyników dev-0
wyniki zapisane
#przewidywanie ceny test-A
pred_data = model(torch.from_numpy(test_data_sizes).requires_grad_()).data.numpy()

print('zapisywanie wyników test-A')

test_of = open(testAout, 'w')
for i in pred_data:
    test_of.write(str(i[0])+'\n')
test_of.close()

print('wyniki zapisane')
zapisywanie wyników test-A