两者可以互补。如果您阅读有关OpenCV的文章,请访问: https : //github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf
它着重指出:“由于HP具有产品中使用的独立开发的页面布局分析技术,因此Tesseract从来不需要自己的页面布局分析。因此,Tesseract假定其输入是带有定义了可选的多边形文本区域。”
此类任务可由OpenCV执行,并将生成的图像移交给Tesseract。您可以在Git存储库中找到此类代码的示例: https : //github.com/Itseez/opencv_contrib/tree/master/modules/text/samples这些示例使用Tesseract API进行图像到文本的转换。
0
我最近遇到过Tesseract和OpenCV 。看起来Tesseract是成熟的OCR引擎,而OpenCV可以用作创建OCR应用程序/服务的框架。
我尝试在某些图像上使用Tesseract,其准确性似乎不错。后来,我遇到了一个有关使用OpenCV使用Python执行OCR的非常简单的教程 ,这给我留下了深刻的印象。几分钟后,我完成了对该系统的培训,其准确性非常好。但是,当然,采用这种方法意味着我需要使用大型训练集来广泛地训练系统。
我的具体问题如下:
有什么建议么?