AL-2020/coder/rocognizer.py

import cv2
import matplotlib.pyplot as plt
import torch
from PIL.Image import Image
from torch import nn
from torchvision.transforms import transforms
from torch.autograd import Variable
import numpy as np

from nn_model import Net


def recognizer(a_path):
    code = []
    path = a_path

    transform = transforms.Compose([transforms.ToTensor(),
                                    transforms.Normalize((0.5,), (0.5,)),
                                    ])

    img = cv2.imread(path)

    img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    img_gray = cv2.GaussianBlur(img_gray, (5, 5), 0)

    ret, im_th = cv2.threshold(img_gray, 90, 255, cv2.THRESH_BINARY_INV)

    ctrs, hier = cv2.findContours(im_th.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    rects = [cv2.boundingRect(ctr) for ctr in ctrs]

    # load nn model
    input_size = 784  # = 28*28
    hidden_sizes = [128, 128, 64]
    output_size = 10
    model = Net()
    model.load_state_dict(torch.load('model.pt'))
    model.eval()

    for rect in rects:
        # Crop image
        crop_img = img[rect[1]:rect[1] + rect[3] + 10, rect[0]:rect[0] + rect[2] + 10, 0]
        # Resize the image
        roi = cv2.resize(crop_img, (28, 28), interpolation=cv2.INTER_CUBIC)
        # roi = cv2.dilate(roi, (3, 3))
        # plt.imshow(roi)
        # plt.show()
        im = transform(roi)
        im = im.view(1, 1, 28, 28)
        with torch.no_grad():
            logps = model(im)
        ps = torch.exp(logps)
        probab = list(ps.numpy()[0])
        code.append(probab.index(max(probab)))

    print(code)
    # cv2.imshow("Code", img)
    # cv2.waitKey()
    return code


recognizer("55555.jpg")
# print(recognizer("55555.jpg"))
finding barcode 2020-05-20 11:45:55 +02:00			`import cv2`
			`import matplotlib.pyplot as plt`
detecting digits 2020-05-30 15:52:48 +02:00			`import torch`
new tests 2020-06-01 00:21:32 +02:00			`from PIL.Image import Image`
img is cropped and transformed to torch 2020-05-31 17:21:05 +02:00			`from torch import nn`
			`from torchvision.transforms import transforms`
working w koncu!!! 2020-06-02 22:06:51 +02:00			`from torch.autograd import Variable`
			`import numpy as np`
finding barcode 2020-05-20 11:45:55 +02:00
working w koncu!!! 2020-06-02 22:06:51 +02:00			`from nn_model import Net`
new tests 2020-06-01 00:21:32 +02:00
finding barcode 2020-05-20 11:45:55 +02:00
working w koncu!!! 2020-06-02 22:06:51 +02:00			`def recognizer(a_path):`
			`code = []`
			`path = a_path`
img is cropped and transformed to torch 2020-05-31 17:21:05 +02:00
working w koncu!!! 2020-06-02 22:06:51 +02:00			`transform = transforms.Compose([transforms.ToTensor(),`
			`transforms.Normalize((0.5,), (0.5,)),`
			`])`
finding barcode 2020-05-20 11:45:55 +02:00
working w koncu!!! 2020-06-02 22:06:51 +02:00			`img = cv2.imread(path)`
finding barcode 2020-05-20 11:45:55 +02:00
working w koncu!!! 2020-06-02 22:06:51 +02:00			`img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)`
			`img_gray = cv2.GaussianBlur(img_gray, (5, 5), 0)`
finding barcode 2020-05-20 11:45:55 +02:00
working w koncu!!! 2020-06-02 22:06:51 +02:00			`ret, im_th = cv2.threshold(img_gray, 90, 255, cv2.THRESH_BINARY_INV)`
finding barcode 2020-05-20 11:45:55 +02:00
working w koncu!!! 2020-06-02 22:06:51 +02:00			`ctrs, hier = cv2.findContours(im_th.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)`
finding barcode 2020-05-20 11:45:55 +02:00
working w koncu!!! 2020-06-02 22:06:51 +02:00			`rects = [cv2.boundingRect(ctr) for ctr in ctrs]`
img is cropped and transformed to torch 2020-05-31 17:21:05 +02:00
working w koncu!!! 2020-06-02 22:06:51 +02:00			`# load nn model`
			`input_size = 784 # = 28*28`
			`hidden_sizes = [128, 128, 64]`
			`output_size = 10`
			`model = Net()`
			`model.load_state_dict(torch.load('model.pt'))`
			`model.eval()`
recognizing but training must be improved 2020-05-20 08:24:33 +02:00
working w koncu!!! 2020-06-02 22:06:51 +02:00			`for rect in rects:`
			`# Crop image`
			`crop_img = img[rect[1]:rect[1] + rect[3] + 10, rect[0]:rect[0] + rect[2] + 10, 0]`
			`# Resize the image`
			`roi = cv2.resize(crop_img, (28, 28), interpolation=cv2.INTER_CUBIC)`
			`# roi = cv2.dilate(roi, (3, 3))`
			`# plt.imshow(roi)`
			`# plt.show()`
			`im = transform(roi)`
			`im = im.view(1, 1, 28, 28)`
			`with torch.no_grad():`
			`logps = model(im)`
			`ps = torch.exp(logps)`
			`probab = list(ps.numpy()[0])`
			`code.append(probab.index(max(probab)))`

			`print(code)`
			`# cv2.imshow("Code", img)`
			`# cv2.waitKey()`
			`return code`


			`recognizer("55555.jpg")`
			`# print(recognizer("55555.jpg"))`