在图像中定位文本
artificial-intelligence
c#
image
image-processing
9
0

我目前正在从事一个项目,我的目标是在图像中定位文本。到目前为止,OCR'ing文本并不是我的意图。我想基本上获取图像内文本的边界。我正在使用AForge.Net映像组件进行操作。在某种意义上有帮助吗?

更新2/5/09:此后,我在项目中走了另一条路。但是,我确实尝试使用MODI(Microsoft Office Document Imaging)获取文本。它使您可以轻松地对图像进行OCR并从中提取文本。

参考资料:
Stack Overflow
收藏
评论
共 2 个回答
高赞 时间 活跃

这是一个活跃的研究领域。从字面上看,有很多关于该主题的学术论文。如果没有更多细节,将很难为您提供帮助。您在寻找特定类型的文字吗?字体?仅限英语?您熟悉学术文献吗?

在任何OCR(光学字符识别)系统中,“文本检测”都是一个标准问题,因此,在互连网上有很多代码可以处理它。

我可以开始列出来自Google的大量链接,但我建议您只是搜索“文本检测”并开始阅读:)。也有足够的示例代码。

收藏
评论

识别图像中的文本确实是该领域研究人员的热门话题,但是直到验证成为防御垃圾邮件机器人的“规范”时才开始失控。为什么要使用验证码作为保护?很好,因为很难(很难)定位(读取)图像中的文本!

我之所以提到验证码,是因为最大的进步是在很小的区域内完成的,我认为您的解决方案最好在那儿找到。特别是因为验证码确实是关于在混乱的图像中定位文本(或类似文本的东西),然后再尝试正确读取字母。

因此,如果您可以找到一个很好的开放源代码验证码破解工具,那么您可能拥有继续完成任务所需要的一切...
您甚至可能会丢弃处理字符识别本身的最困难的代码,因为这些OCR用于读取变形的文本,而您不必这样做。

*:“非研究人员”在可见,可用和实用信息方面的进步

收藏
评论
新手导航
  • 社区规范
  • 提出问题
  • 进行投票
  • 个人资料
  • 优化问题
  • 回答问题