65.9K
CodeProject 正在变化。 阅读更多。
Home

LEADTOOLS OCR:更好的选择

emptyStarIconemptyStarIconemptyStarIconemptyStarIconemptyStarIcon

0/5 (0投票)

2012 年 2 月 1 日

CPOL

4分钟阅读

viewsIcon

70533

downloadIcon

4387

为什么使用 Leadtools ODR SDK 实现光学字符识别是更快、更准确的选择。

引言

光学字符识别 (OCR) 是一项技术和概念,大多数程序员都很熟悉:拍摄带有文字的图片并将其转换为文本。这听起来很简单,但实现起来往往比看起来要难得多。就像观看专业冲浪者并尝试自己做一样,开发人员会在各种字体的图像、扫描效果不佳、灰尘斑点和纸张褶皱的无尽浪潮中遍体鳞伤、疲惫不堪,几乎要淹死,并在您的算法中发现新的问题。

避免一些麻烦,使用 LEADTOOLS,这是市场上最准确、快速且易于使用的 OCR SDK!凭借二十多年的编程经验、一套强大而广泛的文档图像清理功能、支持三十多种语言的线程安全 OCR,以及测试数百万张图像的时间和资源,LEADTOOLS 赢得了财富 500 强公司和个体承包商的信任。

使用 LEADTOOLS 进行编程再简单不过了,它具有高级接口,只需三行代码即可将图像转换为可搜索的 PDF。对于那些需要额外控制或希望执行更高级任务(例如使用区域从表单的特定部分读取单词和字符)的人,LEADTOOLS 提供了对 OCR 应用程序各个方面的低级控制。

LEADTOOLS OCR SDK 中的主要功能

  • 快速而准确的 OCR,支持多线程
  • 广泛的 OCR 语言字符集支持,包括拉丁语、西里尔语、东亚语和阿拉伯语
  • 将 OCR 结果保存为 40 多种输出格式,包括可搜索的 PDF、PDF/A、Word 和 XML
  • 全页和区域 OCR
  • 内置和自定义拼写字典,以改善 OCR 结果
  • 强大的文档图像清理和预处理功能,以改善扫描图像的 OCR 结果
  • 32 位和 64 位 OCR 二进制文件

包含 OCR 技术的 SDK 产品

OCR 代码

任何 SDK 最重要的特征之一是易用性。这是 LEADTOOLS 开发人员的基本概念。在这里,您可以看到如何通过仅三行代码将图像转换为可搜索的 PDF

IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Advantage, false);
ocrEngine.Startup(null, null, null, null);
ocrEngine.AutoRecognizeManager.Run(_strInputFile, _strOutputFile, DocumentFormat.Pdf, 
    null, null);

null 参数用于您可以用来自定义输出和处理的类,例如文件格式设置、文档清理、回调等。传递 null 会使用为大多数扫描文档优化的默认值。这是原始 TIFF 图像和此代码创建的可搜索 PDF 的屏幕截图

OCR-Leadtools/image001.jpg

简单快速的解决方案很棒,但 LEADTOOLS 并没有止步于此,因为我们明白许多项目还需要自定义和更复杂的任务。 LEADTOOLS OCR 接口也足够精细,可以控制流程的每个细节,包括区域、处理单词和字符,甚至在必要时进行拼写检查和修改识别结果。 在下面,LEADTOOLS 用于识别用户在图像上绘制的特定矩形中的文本

// make sure the region isn't empty or the size of the entire image
if (!rasterImageViewer1.Image.HasRegion)
{
   MessageBox.Show("Select a zone in the viewer using the mouse.");
   return;
}
 
// Create OCR Engine
using (IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Advantage,
   false))
{
   // Start the engine using default parameters
   ocrEngine.Startup(null, null, null, null);
 
   // Create OCR Document
   using (IOcrDocument ocrDocument = ocrEngine.DocumentManager.CreateDocument())
   {
      // Add image from the viewer as a page in this document
      IOcrPage ocrPage = ocrDocument.Pages.AddPage(rasterImageViewer1.Image, null);
 
      // Create a zone for the selected region
      OcrZone ocrZone = new OcrZone();
      ocrZone.Bounds = new LogicalRectangle(
          rasterImageViewer1.Image.GetRegionBounds(null));
      ocrZone.ZoneType = OcrZoneType.Text;
      ocrPage.Zones.Add(ocrZone);
 
      // OCR the image and display text in a MessageBox
      MessageBox.Show(ocrPage.RecognizeText(null));
   }
}

OCR-Leadtools/image002.jpg

结论

LEADTOOLS 以易于使用的、高级的编程接口为开发人员提供了世界上性能最佳、最稳定的成像库,从而能够快速开发关键业务应用程序。

OCR 只是 LEADTOOLS 提供的众多技术之一。 有关我们其他产品的更多信息,请务必访问我们的 主页,下载一个功能齐全的免费评估 SDK,并在评估期间利用我们的免费技术支持。

下载完整的 OCR 示例

您可以下载一个完整的演示,其中包含上述功能。要运行此示例,您需要以下内容:

支持

需要帮助来启动和运行此示例吗? 联系我们的支持团队 获得免费的技术支持! 对于定价或许可问题,您可以联系我们的销售团队 (sales@leadtools.com) 或致电 704-332-5532。

关于 LEADTOOLS

自 1990 年以来,LEAD Technologies 一直是数字成像工具的主要提供商。 其屡获殊荣的 LEADTOOLS 工具包系列可帮助开发人员快速轻松地将光栅、文档、医疗、多媒体、矢量和 Internet 成像集成到他们的应用程序中。 使用 LEADTOOLS 满足您的成像需求,让您可以将更多时间花在用户界面和特定于应用程序的代码上,从而加快您的开发周期并提高您的投资回报率。

© . All rights reserved.