DOI：10.3969/j.issn.1000-386x.2023.10.028

融合语言模型的化验单文字识别矫正研究

引用

摘要：

针对自然场景下化验单文字识别容易出现混淆的问题,提出一种融合语言模型的自然场景下的化验单文字识别后处理矫正方法.该方法通过引入统计语言模型,对识别区域矩阵进行条件概率统计,预测符合医学词库的最佳识别结果,使用基于融合的编辑距离和最长公共子序列方法进行检验项名称矫正,根据检验项对应关系对其他指标进行矫正.引入该方法的后处理结果与不加后处理的识别结果相比,在医疗化验单的识别任务上,获得了准确率、召回率、F1 值不同程度的提高.对比实验表明,该方法能够进一步提高文本框文字的识别精度,为后期化验单解读奠定了基础.

关键词：化验单、文字识别、语言模型、编辑距离、最长公共子序列

所属期刊栏目：40

分类号：TP319(计算技术、计算机技术)

资助基金：国家自然科学基金;北京信息科技大学促进高校内涵发展科研水平提高项目;北京信息科技大学勤信人才培育计划项目;北京成像技术高精尖创新中心项目;网络文化与数字传播北京市重点实验室开放基金项目

在线出版日期：2023-11-09（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：179-184,221

英文信息展示

个人中心

我的学术圈

我的书案

退出

期刊专题

融合语言模型的化验单文字识别矫正研究