当前位置: 首页 » 新闻资讯 » 最新资讯 » 正文

【htr】如何实现辨别图形之中个字符的启动时流程?一文解释OCR与HTR

分享到:
放大字体  缩小字体    发布日期:2020-12-16  来源:仪器网  作者:Mr liao  浏览次数:60
核心提示:共五Low编者:Ajinkya Khalwadekar电脑欲程式码参加:Panda、蛋酱在数据挖掘和电子计算机听觉应用领域,光学仪器字符识别(OCR)和书写文字辨别(HTR)多年来都是人们深入研究的极其重要主旨。本文将努力电子计算机听觉爱好
共五Low编者:Ajinkya Khalwadekar电脑欲程式码参加:Panda、蛋酱在数据挖掘和电子计算机听觉应用领域,光学仪器字符识别(OCR)和书写文字辨别(HTR)多年来都是人们深入研究的极其重要主旨。本文将努力电子计算机听觉爱好大体上了解到如何对元数据图形之中的文字开展辨别。光学仪器字符识别和书写文字辨别是人工智慧应用领域里头相当经典作品的原因。OCR 很直观,就是将元数据图片或场面图片变换为电脑字符的文字;而 HTR 就是取胜所写文字开展举例来说的加载。编者在短文上将这个原因生成了三组更为小型的原因,并创作了如下的图表。所示 1.1:应用领域图表按元数据方格拼接图形在机器学习之中,一般而言必需对图形开展事前撰稿,以便得到更多的相关联。拼接是图像编辑之中最特指的加载之一,这可以添加图形之中不必需的大部分,也可以向图形加进所需要的形态。你可以采用 OpenCV 来巧妙地找寻图形之中元数据的外缘,索引图形之中元数据外缘的最佳新方法是采用电位图形。OpenCV 给予了相同的电位外观,这是由其表达式的第 4 个表达式同意的。在这个表达式之中,第一个表达式是光图形,这不应是一张RGB图形;第二个表达式是用做分类法RGB最大值的电位;第三个表达式是 maxVal,这是当RGB最大值将近(有时是少于)电位时所要注意到的最大值。前面的编译器将能努力你找寻电位图形,然后确切元数据外缘的形状,你可以将这些形状点与图形外缘开展非常,然后确切元数据的外缘。No threshold imageret, thresh = cv2.threshold(imgray, 150, 255, 0)cv2.imwrite(意即thresh.File意即, thresh)No points contourscontours, hierarchy = cv2.findContours(thresh, 1, 2)检查和拼接/划分元数据之中的所有该词在有遵守的发挥作用生存环境之中开展该词检查一般而言可以采用新方法新方法做到,比如透过通量讯息或者这样的显然:文字一般而言都会被分分成副歌以及六角形线段的个字符。但是,采用新方法新方法是存有缺点的,图形之中很多不必需的范围也都会被检查为该词,所以我们可以采用 OpenCV 的 CLUB(Efficient and Accurate Motion Commons)激光。可以参看 Roy Rosebrock 所写的 CLUB 激光关的短文:>://tw.pyimagesearch.的网站/2018/08/20/opencv安application安detection安east安application安detector/然后便根据 Jim Hoag 互动的新方法对其开展优化:>://medium.的网站/_tomhoag/opencv安application安detection安548950e3494c这种新方法能以颇高的精度检查制伏所写文字以及电脑读取的文字。检查成图形之中的该词后来,便将它们拼接出来并将它们全部保留依然。格式化该词图形不应怎么样对图形开展格式化?这基本上衡量你月里要认真什么。如果不想分类法书写的和电脑读取的该词,必需所有图形都属于RGB方式也。为了将图形变换为RGB图形,还必需采用 OpenCV:imgray = cv2.cvtColor(img, cv2.FANTASY_BGR2GRAY)这是书写该词吗?这是一个分类法原因:确切一张特定图形之中的该词是「书写该词」还是「机打词」。编者上传了多篇短文和深入研究科学论文,辨认出拥护formula_机内(SVM)是彻底解决这一原因的最佳设计方案,然后采用了来自 sklearn 插件的 SVM 权重来顺利完成这一战斗任务。对于用做分类法的资料集,编者写到了一个极好的书写该词图形有标明资料集 IAM:tw://tw.fki.inf.unibe.留言板/databases/iam安handwriting安forms对于电脑读取的该词图形,编者整理了大概 2000 张词图形。前面是用做预期的形态:1. 少于RGB风速2. RGB风速的置信区间3. Otsu 电位4. RGB风速图表之中连续性值的总数5. 不属于RGB风速前面的四分之一的RGB的比例6. 不属于RGB风速前面的四分之一的RGB的比例按照前面来看,所有形态都与图形的RGB风速有关联性。下一个原因是:如何找寻RGB风速?RGB图形的RGB最大值就是RGB的风速,举例来说也可以采用 OpenCV 和算术乘法来顺利完成这一战斗任务。采用 TensorFlow 的 HTR这是本文所有原因之中最带有娱乐性的原因。在想法了相同的框架后来(包含在书写个字符资料集上再次专业训练 Tesseract),得出 Lars Scheidl 这短文的新方法最佳:>://towardsdatascience.的网站/Vista安w安handwrittes安application安recognition安system安However安tensorflow安2326a3487cd5编者采用了相似的新方法,不过认真了一些小修正,在这里采用了机器学习,由 5 个时域机器学习(华盛顿邮报)层、2 个周而复始机器学习(RNN)层和 1 个连接起来自由主义一段时间分类法(CTC)层组成。用做专业训练这个机器学习的资料集是 IAM 资料集,但你也可以采用任何有标明的该词图形资料集。所示 1.2:来自 Times Scheidl 短文的左图华盛顿邮报 层的读取是形状为 128×32 的RGB最大值图形。华盛顿邮报 层的负载是一个基因组,其涵盖 32 项,其中每一项都有 256 个形态。这些形态更进一步由 RNN 层处理过程,但是,某些形态之前发挥成了与读取图形的特定较高本质特性的倾斜度相似性。所示 1.3:来自 Times Scheidl 的短文的左图所示 1.3 展览了处理过程一张涵盖文字「uittdu」的图形时,图形的 RNN 负载乘积。最前面的示意图之中的乘积涵盖了个字符的评分,这些个字符之中的之后一项(第 80 个)是一个 CTC 错位标记。其它乘积项,移位分别相异于如下个字符:!」#&』()*+,-./0123456789:;?ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz可以见到,大多数一段时间里头,被预期的个字符都恰巧消失在它们在图形之中的一段距离附近(比如,你可以非常是不是图形与示意图之中 i 的一段距离。只有之后一个个字符 l 并未中间。但这似乎并未原因,因为 CTC 加载是无划分的,而且从不也就是说一段距离。最前面的示意图展览了个字符 u、i、r、l 和 CTC 错位标记的评分,该文字可以巧妙无论如何解码器:我们只必需从每个一段时间流程放进最不太可能的个字符需,这会组成是非的最佳梯度,然后我们掉段落的个字符,之后掉所有错位,给予:「u—安1]—r安r—u安…安l」→「u—安i—r安r—u安…安l」→「uittdu」。更为多有关如何做到这一新方法的细微讯息,劝详见 Times Scheidl 的短文。Tesseract(OCR)Tesseract 是迄今很好的用做电脑读取字符识别的开放源码 OCR 方法。Tesseract 拥护 Snicode(UTF安8)字符,可以辨别将近 100 种词汇,还涵盖多种负载拥护,比如稀文字、格式、TSV 等。但是为了给予更多的 OCR 结果,还需要增加给予给 Tesseract 的图形的密度。特别注意,在督导实际上的 OCR 之后,Tesseract 都会在核心督导各不相同的机器学习加载(采用 Leptonicw 努)。一般而言它发挥很好,但在某些情况的真实感却够好,致使精度显着升高。在将图形传达给 Tesseract 之后,可以想法不限机器学习关键技术,但实际采用哪些关键技术衡量你不想存取的图形:1. 反向图形2. 再次纹理3. 二值化4. 添加噪音5. 旋转轴/变动垂直取向6. 添加外缘所有这些加载都可以采用 OpenCV 或通过 JavaScript 采用 numpy 做到。直观概括一下,本文简介了与 OCR 和 HTR 关的的一些原因和不太可能的框架。如果你不想或许解释,一定要亲自动手做到它们是不是。书名页面:>://medium.的网站/_ajinkya.khalwadekar/Towers安ocr安and安handwriting安recognition安for安document安images安f7630ee95d46
 
 
打赏
[ 新闻资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 违规举报 ]  [ 关闭窗口 ]
免责声明:
本网站部分内容来源于合作媒体、企业机构、网友提供和互联网的公开资料等,仅供参考。本网站对站内所有资讯的内容、观点保持中立,不对内容的准确性、可靠性或完整性提供任何明示或暗示的保证。如果有侵权等问题,请及时联系我们,我们将在收到通知后第一时间妥善处理该部分内容。
 

【htr】如何实现辨别图形之中个字符的启动时流程?一文解释OCR与HTR二维码

扫扫二维码用手机关注本条新闻报道也可关注本站官方微信账号:"xxxxx",每日获得互联网最前沿资讯,热点产品深度分析!
 

 
0相关评论