test 6

2024-05-19 22:42:01 +02:00 · 2024-05-19 22:42:01 +02:00 · 8e6b13ca19
commit 8e6b13ca19
parent 10b830e7a0
3 changed files with 603 additions and 602 deletions
--- a/dev-0/out.tsv
+++ b/dev-0/out.tsv
--- a/run.py
+++ b/run.py
@ -4,6 +4,7 @@ from sklearn.model_selection import train_test_split
 import tensorflow as tf
 from keras.optimizers import Adam
 import numpy as np
+import gensim


 def read_data():
@ -15,7 +16,7 @@ def read_data():


 def text_to_vector(text, word2vec, vector_size):
-    words = text.split()
+    words = gensim.utils.simple_preprocess(text)
    text_vector = np.zeros(vector_size)
    word_count = 0
    for word in words:
@ -33,7 +34,7 @@ def main():
    # Word2Vec parameters
    vector_size = 100

-    # Training the Word2Vec model
+    # Loading the Word2Vec model
    word2vec = KeyedVectors.load("fasttext_100_3_polish.bin")

    # Convert text to vectors
--- a/test-A/out.tsv
+++ b/test-A/out.tsv