《医疗OCR用Tesseract稳缩写识别》然而，当医疗文档-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

3 月前

truejaxzheng

《医疗OCR用Tesseract稳缩写识别》
然而，当医疗文档中频繁出现的“BP”（血压）、“MI”（心肌梗死）、“Hx”（病史）等缩写被OCR引擎错误识别为“B P”或“M I”时，数据质量的崩塌不仅导致系统误判，更可能引发临床决策风险。Tesseract默认的OCR引擎（基于CNN+LSTM架构）缺乏领域知识，导致缩写识别错误率高达28.7%（JAMIA 2024研究），远超通用文档的5.2%。图1：Tesseract将“MI”（心肌梗死）错误识别为“M I”，导致电子病历系统误判为“M I”（无临床意义），增加医生人工校验成本。
——来自博客 https://blog.csdn.net/jaxzheng/article/details/156698956

Tesseract在医疗文档中缩写识别错误率高达28.7%。(单选)

0 人已经参与已结束

正确

0人

错误

0人

CSDN App 扫码分享

分享

评论

点赞

复制链接
举报

下一条动态