热门

最新

红包

立Flag

投票

同城

我的

发布
jaxzheng
jaxzheng
3 月前
truejaxzheng

《医疗OCR用Tesseract稳缩写识别》
然而,当医疗文档中频繁出现的“BP”(血压)、“MI”(心肌梗死)、“Hx”(病史)等缩写被OCR引擎错误识别为“B P”或“M I”时,数据质量的崩塌不仅导致系统误判,更可能引发临床决策风险。Tesseract默认的OCR引擎(基于CNN+LSTM架构)缺乏领域知识,导致缩写识别错误率高达28.7%(JAMIA 2024研究),远超通用文档的5.2%。图1:Tesseract将“MI”(心肌梗死)错误识别为“M I”,导致电子病历系统误判为“M I”(无临床意义),增加医生人工校验成本。
——来自博客
https://blog.csdn.net/jaxzheng/article/details/156698956

Tesseract在医疗文档中缩写识别错误率高达28.7%。(单选)
0 人已经参与 已结束
正确
0人
错误
0人
CSDN App 扫码分享
分享
评论
点赞
  • 复制链接
  • 举报
下一条动态
立即登录