finally... after platform change solution works
This commit is contained in:
parent
e4adfb04dc
commit
148368be03
87
dev-0/out.tsv
Normal file
87
dev-0/out.tsv
Normal file
@ -0,0 +1,87 @@
|
||||
39
|
||||
32
|
||||
0
|
||||
20
|
||||
2
|
||||
22
|
||||
41
|
||||
11
|
||||
4
|
||||
5
|
||||
46
|
||||
22
|
||||
30
|
||||
14
|
||||
6
|
||||
25
|
||||
34
|
||||
40
|
||||
18
|
||||
13
|
||||
12
|
||||
23
|
||||
17
|
||||
9
|
||||
11
|
||||
35
|
||||
3
|
||||
17
|
||||
13
|
||||
30
|
||||
24
|
||||
36
|
||||
29
|
||||
47
|
||||
25
|
||||
8
|
||||
44
|
||||
49
|
||||
3
|
||||
20
|
||||
4
|
||||
26
|
||||
41
|
||||
10
|
||||
43
|
||||
15
|
||||
8
|
||||
30
|
||||
11
|
||||
42
|
||||
37
|
||||
0
|
||||
24
|
||||
35
|
||||
7
|
||||
9
|
||||
30
|
||||
30
|
||||
24
|
||||
27
|
||||
8
|
||||
33
|
||||
11
|
||||
31
|
||||
22
|
||||
28
|
||||
1
|
||||
45
|
||||
21
|
||||
8
|
||||
2
|
||||
18
|
||||
16
|
||||
1
|
||||
30
|
||||
11
|
||||
11
|
||||
7
|
||||
10
|
||||
38
|
||||
5
|
||||
48
|
||||
5
|
||||
13
|
||||
1
|
||||
19
|
||||
13
|
|
70
kMeans.ipynb
Normal file
70
kMeans.ipynb
Normal file
@ -0,0 +1,70 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 1,
|
||||
"id": "f7e1ae0d",
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"import pandas as pd\n",
|
||||
"import csv\n",
|
||||
"from sklearn.feature_extraction.text import TfidfVectorizer\n",
|
||||
"from sklearn.cluster import KMeans"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 2,
|
||||
"id": "7582a8dd",
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"#dev0\n",
|
||||
"dev0_data = pd.read_csv('dev-0/in.tsv', header=None, quoting=csv.QUOTE_NONE, sep='\\t')\n",
|
||||
"\n",
|
||||
"dev0_y = KMeans(n_clusters=50).fit_predict(TfidfVectorizer().fit_transform(dev0_data[0].values))\n",
|
||||
"\n",
|
||||
"#zapis wyników\n",
|
||||
"dev0_y.tofile('dev-0/out.tsv', sep='\\n')"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 3,
|
||||
"id": "d3c75abc",
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"#TestA\n",
|
||||
"testA_data = pd.read_csv('test-A/in.tsv', header=None, quoting=csv.QUOTE_NONE, sep='\\t')\n",
|
||||
"\n",
|
||||
"testA_y = KMeans(n_clusters=50).fit_predict(TfidfVectorizer().fit_transform(testA_data[0].values))\n",
|
||||
"\n",
|
||||
"#zapis wyników\n",
|
||||
"testA_y.tofile('test-A/out.tsv', sep='\\n')"
|
||||
]
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"kernelspec": {
|
||||
"display_name": "Python 3",
|
||||
"language": "python",
|
||||
"name": "python3"
|
||||
},
|
||||
"language_info": {
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 3
|
||||
},
|
||||
"file_extension": ".py",
|
||||
"mimetype": "text/x-python",
|
||||
"name": "python",
|
||||
"nbconvert_exporter": "python",
|
||||
"pygments_lexer": "ipython3",
|
||||
"version": "3.8.8"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 5
|
||||
}
|
35
kMeans.py
Normal file
35
kMeans.py
Normal file
@ -0,0 +1,35 @@
|
||||
#!/usr/bin/env python
|
||||
# coding: utf-8
|
||||
|
||||
# In[1]:
|
||||
|
||||
|
||||
import pandas as pd
|
||||
import csv
|
||||
from sklearn.feature_extraction.text import TfidfVectorizer
|
||||
from sklearn.cluster import KMeans
|
||||
|
||||
|
||||
# In[2]:
|
||||
|
||||
|
||||
#dev0
|
||||
dev0_data = pd.read_csv('dev-0/in.tsv', header=None, quoting=csv.QUOTE_NONE, sep='\t')
|
||||
|
||||
dev0_y = KMeans(n_clusters=50).fit_predict(TfidfVectorizer().fit_transform(dev0_data[0].values))
|
||||
|
||||
#zapis wyników
|
||||
dev0_y.tofile('dev-0/out.tsv', sep='\n')
|
||||
|
||||
|
||||
# In[3]:
|
||||
|
||||
|
||||
#TestA
|
||||
testA_data = pd.read_csv('test-A/in.tsv', header=None, quoting=csv.QUOTE_NONE, sep='\t')
|
||||
|
||||
testA_y = KMeans(n_clusters=50).fit_predict(TfidfVectorizer().fit_transform(testA_data[0].values))
|
||||
|
||||
#zapis wyników
|
||||
testA_y.tofile('test-A/out.tsv', sep='\n')
|
||||
|
691
test-A/out.tsv
Normal file
691
test-A/out.tsv
Normal file
@ -0,0 +1,691 @@
|
||||
22
|
||||
48
|
||||
25
|
||||
10
|
||||
33
|
||||
8
|
||||
13
|
||||
39
|
||||
24
|
||||
47
|
||||
26
|
||||
4
|
||||
15
|
||||
24
|
||||
3
|
||||
18
|
||||
33
|
||||
12
|
||||
33
|
||||
3
|
||||
12
|
||||
34
|
||||
8
|
||||
9
|
||||
0
|
||||
23
|
||||
0
|
||||
28
|
||||
39
|
||||
0
|
||||
21
|
||||
39
|
||||
8
|
||||
2
|
||||
38
|
||||
48
|
||||
4
|
||||
19
|
||||
2
|
||||
21
|
||||
43
|
||||
33
|
||||
17
|
||||
21
|
||||
26
|
||||
26
|
||||
26
|
||||
11
|
||||
25
|
||||
3
|
||||
25
|
||||
19
|
||||
10
|
||||
9
|
||||
28
|
||||
7
|
||||
19
|
||||
25
|
||||
17
|
||||
45
|
||||
19
|
||||
17
|
||||
0
|
||||
47
|
||||
24
|
||||
46
|
||||
9
|
||||
8
|
||||
17
|
||||
24
|
||||
28
|
||||
38
|
||||
33
|
||||
18
|
||||
19
|
||||
33
|
||||
1
|
||||
45
|
||||
43
|
||||
23
|
||||
23
|
||||
6
|
||||
5
|
||||
48
|
||||
33
|
||||
16
|
||||
33
|
||||
41
|
||||
24
|
||||
43
|
||||
24
|
||||
28
|
||||
38
|
||||
33
|
||||
33
|
||||
17
|
||||
22
|
||||
0
|
||||
19
|
||||
19
|
||||
14
|
||||
34
|
||||
33
|
||||
41
|
||||
4
|
||||
42
|
||||
14
|
||||
23
|
||||
12
|
||||
16
|
||||
15
|
||||
2
|
||||
24
|
||||
25
|
||||
12
|
||||
18
|
||||
17
|
||||
16
|
||||
14
|
||||
10
|
||||
45
|
||||
39
|
||||
20
|
||||
17
|
||||
19
|
||||
2
|
||||
33
|
||||
7
|
||||
15
|
||||
19
|
||||
28
|
||||
38
|
||||
12
|
||||
7
|
||||
26
|
||||
38
|
||||
36
|
||||
23
|
||||
5
|
||||
10
|
||||
20
|
||||
26
|
||||
45
|
||||
36
|
||||
14
|
||||
10
|
||||
17
|
||||
36
|
||||
29
|
||||
7
|
||||
33
|
||||
17
|
||||
17
|
||||
3
|
||||
9
|
||||
4
|
||||
33
|
||||
45
|
||||
18
|
||||
34
|
||||
37
|
||||
12
|
||||
42
|
||||
11
|
||||
28
|
||||
17
|
||||
5
|
||||
37
|
||||
38
|
||||
38
|
||||
48
|
||||
28
|
||||
21
|
||||
19
|
||||
33
|
||||
5
|
||||
9
|
||||
26
|
||||
7
|
||||
30
|
||||
6
|
||||
11
|
||||
45
|
||||
16
|
||||
14
|
||||
0
|
||||
39
|
||||
5
|
||||
39
|
||||
28
|
||||
22
|
||||
14
|
||||
4
|
||||
42
|
||||
39
|
||||
45
|
||||
10
|
||||
25
|
||||
10
|
||||
22
|
||||
23
|
||||
31
|
||||
22
|
||||
26
|
||||
33
|
||||
17
|
||||
25
|
||||
11
|
||||
16
|
||||
22
|
||||
24
|
||||
43
|
||||
19
|
||||
33
|
||||
11
|
||||
4
|
||||
39
|
||||
8
|
||||
44
|
||||
24
|
||||
3
|
||||
7
|
||||
23
|
||||
30
|
||||
5
|
||||
38
|
||||
37
|
||||
12
|
||||
40
|
||||
19
|
||||
17
|
||||
41
|
||||
7
|
||||
11
|
||||
8
|
||||
24
|
||||
38
|
||||
9
|
||||
19
|
||||
10
|
||||
22
|
||||
24
|
||||
46
|
||||
26
|
||||
23
|
||||
44
|
||||
28
|
||||
28
|
||||
26
|
||||
11
|
||||
24
|
||||
16
|
||||
6
|
||||
21
|
||||
31
|
||||
5
|
||||
12
|
||||
3
|
||||
19
|
||||
45
|
||||
7
|
||||
39
|
||||
13
|
||||
23
|
||||
36
|
||||
12
|
||||
10
|
||||
16
|
||||
31
|
||||
39
|
||||
26
|
||||
12
|
||||
28
|
||||
45
|
||||
8
|
||||
13
|
||||
26
|
||||
15
|
||||
45
|
||||
18
|
||||
12
|
||||
28
|
||||
13
|
||||
24
|
||||
15
|
||||
27
|
||||
49
|
||||
25
|
||||
17
|
||||
8
|
||||
19
|
||||
24
|
||||
14
|
||||
23
|
||||
48
|
||||
28
|
||||
17
|
||||
27
|
||||
17
|
||||
26
|
||||
26
|
||||
12
|
||||
16
|
||||
28
|
||||
28
|
||||
26
|
||||
33
|
||||
13
|
||||
16
|
||||
19
|
||||
17
|
||||
1
|
||||
18
|
||||
21
|
||||
40
|
||||
16
|
||||
28
|
||||
45
|
||||
11
|
||||
47
|
||||
43
|
||||
5
|
||||
34
|
||||
1
|
||||
19
|
||||
43
|
||||
16
|
||||
33
|
||||
14
|
||||
26
|
||||
33
|
||||
19
|
||||
13
|
||||
7
|
||||
19
|
||||
25
|
||||
23
|
||||
18
|
||||
28
|
||||
10
|
||||
19
|
||||
29
|
||||
39
|
||||
3
|
||||
9
|
||||
45
|
||||
41
|
||||
4
|
||||
42
|
||||
43
|
||||
14
|
||||
32
|
||||
28
|
||||
39
|
||||
33
|
||||
19
|
||||
28
|
||||
23
|
||||
41
|
||||
47
|
||||
37
|
||||
26
|
||||
14
|
||||
24
|
||||
28
|
||||
23
|
||||
2
|
||||
21
|
||||
32
|
||||
37
|
||||
17
|
||||
19
|
||||
4
|
||||
20
|
||||
39
|
||||
28
|
||||
7
|
||||
17
|
||||
7
|
||||
12
|
||||
38
|
||||
23
|
||||
26
|
||||
13
|
||||
22
|
||||
15
|
||||
47
|
||||
4
|
||||
41
|
||||
8
|
||||
12
|
||||
46
|
||||
0
|
||||
25
|
||||
33
|
||||
48
|
||||
22
|
||||
12
|
||||
33
|
||||
26
|
||||
26
|
||||
10
|
||||
7
|
||||
39
|
||||
7
|
||||
3
|
||||
19
|
||||
39
|
||||
29
|
||||
39
|
||||
43
|
||||
27
|
||||
39
|
||||
23
|
||||
7
|
||||
28
|
||||
32
|
||||
28
|
||||
23
|
||||
14
|
||||
23
|
||||
49
|
||||
20
|
||||
8
|
||||
37
|
||||
31
|
||||
25
|
||||
33
|
||||
28
|
||||
3
|
||||
17
|
||||
9
|
||||
11
|
||||
19
|
||||
6
|
||||
29
|
||||
33
|
||||
39
|
||||
9
|
||||
8
|
||||
44
|
||||
25
|
||||
43
|
||||
19
|
||||
33
|
||||
30
|
||||
18
|
||||
6
|
||||
39
|
||||
26
|
||||
23
|
||||
48
|
||||
11
|
||||
39
|
||||
35
|
||||
19
|
||||
24
|
||||
11
|
||||
9
|
||||
28
|
||||
14
|
||||
42
|
||||
3
|
||||
16
|
||||
21
|
||||
47
|
||||
25
|
||||
23
|
||||
20
|
||||
43
|
||||
43
|
||||
16
|
||||
43
|
||||
19
|
||||
16
|
||||
26
|
||||
31
|
||||
19
|
||||
17
|
||||
44
|
||||
37
|
||||
5
|
||||
24
|
||||
23
|
||||
24
|
||||
35
|
||||
17
|
||||
1
|
||||
31
|
||||
16
|
||||
20
|
||||
25
|
||||
11
|
||||
24
|
||||
15
|
||||
19
|
||||
39
|
||||
36
|
||||
13
|
||||
32
|
||||
39
|
||||
25
|
||||
16
|
||||
19
|
||||
19
|
||||
18
|
||||
34
|
||||
18
|
||||
15
|
||||
26
|
||||
8
|
||||
37
|
||||
24
|
||||
16
|
||||
19
|
||||
4
|
||||
30
|
||||
33
|
||||
48
|
||||
11
|
||||
21
|
||||
23
|
||||
37
|
||||
12
|
||||
23
|
||||
33
|
||||
16
|
||||
40
|
||||
39
|
||||
21
|
||||
6
|
||||
12
|
||||
33
|
||||
2
|
||||
14
|
||||
34
|
||||
23
|
||||
3
|
||||
28
|
||||
42
|
||||
25
|
||||
27
|
||||
33
|
||||
35
|
||||
39
|
||||
8
|
||||
44
|
||||
21
|
||||
23
|
||||
15
|
||||
18
|
||||
43
|
||||
31
|
||||
33
|
||||
38
|
||||
6
|
||||
22
|
||||
22
|
||||
38
|
||||
46
|
||||
8
|
||||
25
|
||||
45
|
||||
39
|
||||
23
|
||||
23
|
||||
7
|
||||
28
|
||||
39
|
||||
38
|
||||
25
|
||||
25
|
||||
24
|
||||
16
|
||||
43
|
||||
4
|
||||
15
|
||||
41
|
||||
4
|
||||
19
|
||||
7
|
||||
45
|
||||
12
|
||||
8
|
||||
12
|
||||
19
|
||||
6
|
||||
7
|
||||
45
|
||||
28
|
||||
30
|
||||
24
|
||||
23
|
||||
8
|
||||
24
|
||||
48
|
||||
22
|
||||
29
|
||||
29
|
||||
20
|
||||
25
|
||||
3
|
||||
28
|
||||
24
|
||||
7
|
||||
35
|
||||
28
|
||||
15
|
||||
35
|
||||
26
|
||||
4
|
||||
15
|
||||
22
|
||||
41
|
||||
4
|
||||
12
|
||||
45
|
||||
32
|
||||
16
|
||||
16
|
||||
45
|
||||
34
|
||||
28
|
||||
25
|
||||
16
|
||||
5
|
||||
26
|
||||
23
|
||||
17
|
||||
26
|
||||
4
|
||||
11
|
||||
19
|
||||
33
|
||||
39
|
||||
23
|
||||
5
|
||||
9
|
||||
44
|
||||
23
|
||||
3
|
||||
22
|
||||
28
|
||||
7
|
||||
39
|
||||
37
|
||||
12
|
||||
10
|
||||
12
|
||||
48
|
||||
28
|
||||
26
|
||||
6
|
||||
4
|
||||
24
|
||||
7
|
||||
17
|
||||
31
|
||||
4
|
||||
24
|
||||
4
|
||||
8
|
||||
12
|
||||
16
|
||||
17
|
||||
21
|
||||
44
|
||||
12
|
||||
32
|
||||
14
|
||||
15
|
||||
33
|
||||
43
|
||||
37
|
||||
16
|
||||
40
|
||||
19
|
||||
28
|
||||
14
|
||||
12
|
||||
44
|
||||
38
|
||||
23
|
||||
37
|
||||
15
|
||||
2
|
||||
3
|
||||
41
|
||||
22
|
||||
47
|
||||
37
|
|
Loading…
Reference in New Issue
Block a user