如何获得索引服务和MODI以通过OCR生成全文?

我已配置索引服务来索引我的文件,其中还包括保存为高分辨率TIFF文件的扫描图像。我还安装了MS Office 2003+并正确配置了MS Office Document Imaging(MODI),这样我就可以在我的图像上执行OCR,甚至可以将OCR文本嵌入到TIFF中。

索引服务能够索引并查找手动OCR并重新保存文本数据的TIFF(使用MS Document Imaging工具)。

事实证明,在Windows XP SP2中部署的数据执行保护(DEP)认为MODI是恶意的,并拒绝让它发挥它的魔力。我已经能够通过完全关闭DEP来实现它,但我发现这种解决方案不够优雅。

有没有更好的解决方案,使其工作,而不禁用DEP?

0
额外 编辑
意见: 2
我尝试了同样的事情,并遇到了一些相同的限制。此外,我发现MODI太慢,无法索引大量图像。
额外 作者 Leon Bambrick,
@TuncayGöncüo?lu:是的,我早就从Modi和Indexing Service转移过来了。我只是为了历史的目的而保留这个非常古老的问题。
额外 作者 Ishmaeel,
似乎有一个修补程序解决此问题。
额外 作者 Greg Hurlman,
我不知道你的环境,但不是依靠一些可能在许多关节处破裂的混合魔法,为什么不使用tesseract ocr + lucene来做一个小应用程序?
额外 作者 Tuncay Göncüoğlu,

没有回复。

0