目录

调研olmOCR解析PDF

【调研】olmOCR解析PDF

测试用例:

https://i-blog.csdnimg.cn/direct/007dbb41c8504cd190dc15bc77bfeddb.png

olmOCRGOT-OCR
将最底下没有文字的部分,可能是样式解析出重复
olmOCRGOT-OCR
无重复重复

速度上,olmOCR效果更快

效果上,olmOCR解析得到的内容排版更加清晰整齐,而且对于6份GOT-OCR有重复的测试例子,olmOCR有明显的更好的无重复的效果

可以后续采用部署olmOCR来替代GOT-OCR