26.6895

2021-05-13 19:09:09 +02:00
7 changed files with 260744 additions and 0 deletions
--- a/Main.py
+++ b/Main.py
@ -0,0 +1,19 @@
+from sklearn.feature_extraction.text import TfidfVectorizer
+from sklearn.linear_model import LinearRegression
+from stop_words import get_stop_words
+
+import pandas as pd
+
+meh = TfidfVectorizer(stop_words = get_stop_words('polish'))
+linReg = LinearRegression()
+colnames = ['start_date', 'end_date', 'title', 'sort_title', 'data']
+t = pd.read_csv('test-A/in.tsv', sep = "\t", names = colnames)
+datFin = pd.read_csv('train/train.tsv', sep = "\t", names = colnames)
+date = (datFin['start_date'] + datFin['end_date']) / 2
+trn = meh.fit_transform(datFin['data'])
+linReg.fit(trn, date)
+r = meh.transform(t['data'])
+x = linReg.predict(r)
+with open('test-A/out.tsv', 'w') as file:
+    for each in x:
+        file.write("%f\n" % each)
--- a/dev-0/out.tsv
+++ b/dev-0/out.tsv
--- a/dev-1/out.tsv
+++ b/dev-1/out.tsv
--- a/BIN
+++ b/BIN
--- a/test-A/out.tsv
+++ b/test-A/out.tsv
--- a/train/meta.tsv
+++ b/train/meta.tsv
--- a/train/train.tsv
+++ b/train/train.tsv