paranormal-or-skeptic-ISI-s.../main.py

import numpy as np
from sklearn.preprocessing import LabelEncoder
from sklearn.naive_bayes import MultinomialNB
from sklearn.pipeline import make_pipeline
from sklearn.feature_extraction.text import TfidfVectorizer

def Create_model(X_tsv, Y_tsv):

    with open(X_tsv) as f:
        X = f.readlines()

    with open(Y_tsv) as f:
        Y = f.readlines() 

    Y = LabelEncoder().fit_transform(Y)
    pipeline = make_pipeline(TfidfVectorizer(),MultinomialNB())

    return pipeline.fit(X, Y)


def predict(model, X_tsv, file_name):

    with open(X_tsv) as f:
        X = f.readlines()

    prediction = model.predict(X)
    np.savetxt(file_name, prediction, fmt='%d')


def main():
    
    model = Create_model("train/in.tsv", "train/expected.tsv")

    predict(model, "dev-0/in.tsv", "dev-0/out.tsv")
    predict(model, "test-A/in.tsv", "test-A/out.tsv")


if __name__ == '__main__':
    main()
Demo Version 2021-05-08 19:02:05 +02:00			`import numpy as np`
			`from sklearn.preprocessing import LabelEncoder`
			`from sklearn.naive_bayes import MultinomialNB`
Pre-final Version 2021-05-08 22:45:55 +02:00			`from sklearn.pipeline import make_pipeline`
Demo Version 2021-05-08 19:02:05 +02:00			`from sklearn.feature_extraction.text import TfidfVectorizer`

Pre-final Version 2021-05-08 22:45:55 +02:00			`def Create_model(X_tsv, Y_tsv):`
Demo Version 2021-05-08 19:02:05 +02:00
Pre-final Version 2021-05-08 22:45:55 +02:00			`with open(X_tsv) as f:`
			`X = f.readlines()`
Demo Version 2021-05-08 19:02:05 +02:00
Pre-final Version 2021-05-08 22:45:55 +02:00			`with open(Y_tsv) as f:`
			`Y = f.readlines()`
Demo Version 2021-05-08 19:02:05 +02:00
Pre-final Version 2021-05-08 22:45:55 +02:00			`Y = LabelEncoder().fit_transform(Y)`
			`pipeline = make_pipeline(TfidfVectorizer(),MultinomialNB())`
Demo Version 2021-05-08 19:02:05 +02:00
Pre-final Version 2021-05-08 22:45:55 +02:00			`return pipeline.fit(X, Y)`
Demo Version 2021-05-08 19:02:05 +02:00
Pre-final Version 2021-05-08 22:45:55 +02:00
			`def predict(model, X_tsv, file_name):`

			`with open(X_tsv) as f:`
			`X = f.readlines()`

			`prediction = model.predict(X)`
			`np.savetxt(file_name, prediction, fmt='%d')`
Demo Version 2021-05-08 19:02:05 +02:00

			`def main():`
Pre-final Version 2021-05-08 22:45:55 +02:00
			`model = Create_model("train/in.tsv", "train/expected.tsv")`

Demo Version 2021-05-08 19:02:05 +02:00			`predict(model, "dev-0/in.tsv", "dev-0/out.tsv")`
			`predict(model, "test-A/in.tsv", "test-A/out.tsv")`


			`if __name__ == '__main__':`
			`main()`