26.6895

2021-05-13 19:09:09 +02:00
7 changed files with 260744 additions and 0 deletions
--- a/Main.py
+++ b/Main.py
@ -0,0 +1,19 @@
 from sklearn.feature_extraction.text import TfidfVectorizer
 from sklearn.linear_model import LinearRegression
 from stop_words import get_stop_words
 import pandas as pd
 meh = TfidfVectorizer(stop_words = get_stop_words('polish'))
 linReg = LinearRegression()
 colnames = ['start_date', 'end_date', 'title', 'sort_title', 'data']
 t = pd.read_csv('test-A/in.tsv', sep = "\t", names = colnames)
 datFin = pd.read_csv('train/train.tsv', sep = "\t", names = colnames)
 date = (datFin['start_date'] + datFin['end_date']) / 2
 trn = meh.fit_transform(datFin['data'])
 linReg.fit(trn, date)
 r = meh.transform(t['data'])
 x = linReg.predict(r)
 with open('test-A/out.tsv', 'w') as file:
    for each in x:
        file.write("%f\n" % each)
--- a/dev-0/out.tsv
+++ b/dev-0/out.tsv
--- a/dev-1/out.tsv
+++ b/dev-1/out.tsv
--- a/BIN
+++ b/BIN
--- a/test-A/out.tsv
+++ b/test-A/out.tsv
--- a/train/meta.tsv
+++ b/train/meta.tsv
--- a/train/train.tsv
+++ b/train/train.tsv