在图像中查找文本

我目前正在研究一个项目,我的目标是在图像中查找文本。 OCR的文本是不是我的意图到目前为止。我想基本上获得图像内文本的边界。我正在使用AForge.Net成像组件进行操作。在某种意义上或其他方面的协助?

2009年2月5日更新: 我从此在我的项目中走过另一条路线。不过,我尝试使用MODI(Microsoft Office Document Imaging)获取文本。它使您可以轻松地OCR图像并从中拉出文本。

0
额外 编辑
意见: 2

4 答案

这是一个活跃的研究领域。关于这个问题,学术论文的字面上有很多。特别是没有更多的资格,给你提供帮助将会很困难。你在寻找特定类型的文字吗?字体?仅限英语?你熟悉学术文献吗?

“文本检测”是任何OCR(光学字符识别)系统中的标准问题,因此在处理它的网页上有很多代码。

我可以开始列出从谷歌链接堆,但我建议你只是做一个“文本检测”的搜索,并开始阅读:)。还有充足的示例代码可用。

0
额外

如果您可以使用在线API进行此操作,请在 http://www.wisetrend。 com / wisetrend_ocr_cloud.shtml 除了OCR之外还可以进行文本检测。

0
额外

识别图像中的文本确实是该领域研究人员的热门话题,但当人们开始认识到文本内部的文本时,才开始失去控制,当 captcha的成为防范垃圾邮件机器人的“标准”。为什么使用captcha作为保护?因为它很难在图像中查找(并阅读)文本!

我之所以提到captcha的原因是因为最大的进步*是在这个微小的区域内完成的,我认为你的解决方案可以在那里找到最好的。 特别是因为验证码的确是关于在混乱的图像中查找文本(或类似文本的东西),然后尝试正确地读取这些字母。

所以如果你能找到自己的一个很好的开源captcha破解工具,你可能已经拥有了所有你需要的东西继续你的追求...
你甚至可以扔掉处理字符识别本身的最困难的代码,因为这些OCR被用来读取扭曲的文本,这是你不需要做的。

*:在“非研究人员”的可见性,可用性和实用性信息方面取得进展

0
额外
提到验证码的另一个原因是,这可能是他的“项目”。 :-)
额外 作者 T.E.D.,

Stroke width transform can do that for you. That's at least what MS developed for their mobile phone OS. A discussion on the implementation is here at https://stackoverflow.com/

0
额外