Script fix
This commit is contained in:
parent
60b2708888
commit
89a269ccda
@ -24,7 +24,7 @@ for sentence in sentences:
|
|||||||
spl = [x.lower() for x in spl]
|
spl = [x.lower() for x in spl]
|
||||||
splited.append(spl)
|
splited.append(spl)
|
||||||
documents = [TaggedDocument(doc, [i]) for i, doc in enumerate(splited)]
|
documents = [TaggedDocument(doc, [i]) for i, doc in enumerate(splited)]
|
||||||
model = Doc2Vec(documents, min_count=0, alpha=0.025, epochs=20)
|
model = Doc2Vec(documents, min_count=0, alpha=0.025, epochs=400)
|
||||||
# for epoch in range(10):
|
# for epoch in range(10):
|
||||||
# print('Training epoch %s', epoch)
|
# print('Training epoch %s', epoch)
|
||||||
# model.train()
|
# model.train()
|
||||||
@ -34,7 +34,7 @@ model = Doc2Vec(documents, min_count=0, alpha=0.025, epochs=20)
|
|||||||
|
|
||||||
X = model.dv.vectors
|
X = model.dv.vectors
|
||||||
|
|
||||||
kmeans = KMeans(n_clusters=clusters_no, max_iter=1000).fit(X)
|
kmeans = KMeans(n_clusters=clusters_no, max_iter=4000).fit(X)
|
||||||
labels = kmeans.labels_
|
labels = kmeans.labels_
|
||||||
centroids = kmeans.cluster_centers_
|
centroids = kmeans.cluster_centers_
|
||||||
|
|
||||||
|
156
dev-0/out.tsv
156
dev-0/out.tsv
@ -1,87 +1,87 @@
|
|||||||
9
|
|
||||||
2
|
|
||||||
8
|
|
||||||
5
|
|
||||||
0
|
|
||||||
2
|
|
||||||
2
|
|
||||||
6
|
|
||||||
1
|
|
||||||
5
|
5
|
||||||
2
|
2
|
||||||
8
|
|
||||||
0
|
|
||||||
8
|
|
||||||
8
|
|
||||||
8
|
|
||||||
8
|
|
||||||
8
|
|
||||||
2
|
|
||||||
0
|
|
||||||
8
|
|
||||||
8
|
|
||||||
2
|
|
||||||
2
|
|
||||||
2
|
|
||||||
4
|
|
||||||
9
|
|
||||||
2
|
|
||||||
7
|
|
||||||
8
|
|
||||||
9
|
|
||||||
7
|
|
||||||
2
|
|
||||||
5
|
|
||||||
8
|
|
||||||
7
|
|
||||||
2
|
|
||||||
8
|
|
||||||
9
|
|
||||||
8
|
|
||||||
7
|
|
||||||
5
|
|
||||||
8
|
|
||||||
2
|
|
||||||
7
|
|
||||||
2
|
|
||||||
8
|
|
||||||
0
|
|
||||||
1
|
|
||||||
2
|
|
||||||
0
|
|
||||||
5
|
|
||||||
7
|
|
||||||
8
|
|
||||||
7
|
|
||||||
7
|
|
||||||
7
|
|
||||||
6
|
|
||||||
2
|
|
||||||
8
|
|
||||||
7
|
|
||||||
2
|
|
||||||
2
|
|
||||||
2
|
|
||||||
7
|
|
||||||
8
|
|
||||||
7
|
|
||||||
8
|
|
||||||
8
|
|
||||||
2
|
|
||||||
8
|
|
||||||
2
|
|
||||||
0
|
|
||||||
0
|
|
||||||
9
|
|
||||||
3
|
3
|
||||||
6
|
3
|
||||||
|
4
|
||||||
|
4
|
||||||
|
5
|
||||||
7
|
7
|
||||||
|
4
|
||||||
|
3
|
||||||
|
3
|
||||||
|
4
|
||||||
|
1
|
||||||
|
3
|
||||||
|
3
|
||||||
|
3
|
||||||
|
3
|
||||||
|
3
|
||||||
|
3
|
||||||
2
|
2
|
||||||
|
3
|
||||||
|
3
|
||||||
|
3
|
||||||
|
3
|
||||||
|
5
|
||||||
|
4
|
||||||
|
4
|
||||||
|
3
|
||||||
|
4
|
||||||
|
3
|
||||||
|
9
|
||||||
|
5
|
||||||
|
5
|
||||||
|
3
|
||||||
|
3
|
||||||
|
5
|
||||||
|
3
|
||||||
|
3
|
||||||
|
4
|
||||||
|
3
|
||||||
|
4
|
||||||
|
3
|
||||||
|
5
|
||||||
|
5
|
||||||
|
3
|
||||||
|
3
|
||||||
|
5
|
||||||
|
1
|
||||||
6
|
6
|
||||||
5
|
5
|
||||||
4
|
1
|
||||||
|
3
|
||||||
5
|
5
|
||||||
7
|
3
|
||||||
4
|
3
|
||||||
|
3
|
||||||
|
1
|
||||||
|
0
|
||||||
5
|
5
|
||||||
9
|
3
|
||||||
|
5
|
||||||
|
3
|
||||||
|
5
|
||||||
|
3
|
||||||
|
4
|
||||||
|
3
|
||||||
|
5
|
||||||
|
3
|
||||||
|
3
|
||||||
|
5
|
||||||
|
3
|
||||||
|
3
|
||||||
|
5
|
||||||
|
2
|
||||||
|
5
|
||||||
|
2
|
||||||
|
1
|
||||||
|
3
|
||||||
|
5
|
||||||
|
1
|
||||||
|
3
|
||||||
|
4
|
||||||
|
3
|
||||||
|
2
|
||||||
|
4
|
||||||
|
3
|
||||||
|
8
|
||||||
|
|
Loading…
Reference in New Issue
Block a user