OpenCV MSER检测文本区域-Python
image-processing
ocr
opencv
python
9
0

我有一张发票图像,我想检测它上的文字。因此,我计划使用2个步骤:首先是识别文本区域,然后使用OCR识别文本。

我为此在python中使用OpenCV 3.0。我能够识别文本(包括一些非文本区域),但我还想从图像中识别文本框(也排除非文本区域)。

我的输入图像是: 原版的输出为: 处理我为此使用以下代码:

img = cv2.imread('/home/mis/Text_Recognition/bill.jpg')
mser = cv2.MSER_create()
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #Converting to GrayScale
gray_img = img.copy()

regions = mser.detectRegions(gray, None)
hulls = [cv2.convexHull(p.reshape(-1, 1, 2)) for p in regions]
cv2.polylines(gray_img, hulls, 1, (0, 0, 255), 2)
cv2.imwrite('/home/mis/Text_Recognition/amit.jpg', gray_img) #Saving

现在,我要标识文本框,并删除/取消标识发票上的所有非文本区域。我是OpenCV的新手,也是Python的初学者。我可以在MATAB示例C ++示例中找到一些示例,但是如果我将它们转换为python,这将花费很多时间。

有没有使用OpenCV的python示例,或者有人可以帮助我吗?

参考资料:
Stack Overflow
收藏
评论
共 1 个回答
高赞 时间 活跃

下面是代码

# Import packages 
import cv2
import numpy as np

#Create MSER object
mser = cv2.MSER_create()

#Your image path i-e receipt path
img = cv2.imread('/home/rafiullah/PycharmProjects/python-ocr-master/receipts/73.jpg')

#Convert to gray scale
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

vis = img.copy()

#detect regions in gray scale image
regions, _ = mser.detectRegions(gray)

hulls = [cv2.convexHull(p.reshape(-1, 1, 2)) for p in regions]

cv2.polylines(vis, hulls, 1, (0, 255, 0))

cv2.imshow('img', vis)

cv2.waitKey(0)

mask = np.zeros((img.shape[0], img.shape[1], 1), dtype=np.uint8)

for contour in hulls:

    cv2.drawContours(mask, [contour], -1, (255, 255, 255), -1)

#this is used to find only text regions, remaining are ignored
text_only = cv2.bitwise_and(img, img, mask=mask)

cv2.imshow("text only", text_only)

cv2.waitKey(0)
收藏
评论
新手导航
  • 社区规范
  • 提出问题
  • 进行投票
  • 个人资料
  • 优化问题
  • 回答问题

关于我们

常见问题

内容许可

联系我们

@2020 AskGo
京ICP备20001863号