polish-urban-legends-426228/prog-testA.py

from sklearn.feature_extraction.text import TfidfVectorizer
import numpy as np
import sklearn.metrics
from sklearn.cluster import KMeans

with open("test-A/in.tsv") as f:
    content = f.readlines()
    vectorizer = TfidfVectorizer(ngram_range=(1,2), use_idf = False)
    vectorizer = TfidfVectorizer()
    document_vectors = vectorizer.fit_transform(content)
    kmeans = KMeans(n_clusters=77, random_state=0).fit(document_vectors)
    pred_y = kmeans.fit_predict(document_vectors)
    t=kmeans.labels_
    t=np.array2string(t, precision=2, separator='\n',suppress_small=True)
    f = open("test-A/out.tsv", "a")
    f.write(t)
init 2021-04-13 00:35:55 +02:00			`from sklearn.feature_extraction.text import TfidfVectorizer`
			`import numpy as np`
			`import sklearn.metrics`
			`from sklearn.cluster import KMeans`

update 2021-04-13 11:19:34 +02:00			`with open("test-A/in.tsv") as f:`
init 2021-04-13 00:35:55 +02:00			`content = f.readlines()`
			`vectorizer = TfidfVectorizer(ngram_range=(1,2), use_idf = False)`
			`vectorizer = TfidfVectorizer()`
			`document_vectors = vectorizer.fit_transform(content)`
update 2021-04-13 11:19:34 +02:00			`kmeans = KMeans(n_clusters=77, random_state=0).fit(document_vectors)`
init 2021-04-13 00:35:55 +02:00			`pred_y = kmeans.fit_predict(document_vectors)`
update 2021-04-13 11:19:34 +02:00			`t=kmeans.labels_`
			`t=np.array2string(t, precision=2, separator='\n',suppress_small=True)`
			`f = open("test-A/out.tsv", "a")`
			`f.write(t)`