吊打一切現有開源OCR項目:效果再升7%,速度提升220%
吊打一切現有開源OCR項目:效果再升7%,速度提升220%
資料來源: https://mp.weixin.qq.com/s/mMWXxoIXg2IO5Bc2VxQRVw
OCR方向的工程師,之前一定聽說過PaddleOCR這個項目,其主要推薦的PP-OCR算法更是被國內外企業開發者廣泛應用,短短半年時間,頻頻登上Github Trending和Paperswithcode 日榜月榜第一,在《Github 2020數字洞察報告》中被評為稱它為最近,由PaddleOCR原創團隊,針對PP-OCR進行了一些經驗性改進,構建了一種新的OCR系統,稱為PP-OCRv2。
★檢測模型優化:採用CML協同互學習知識蒸餾策略;
★檢測模型優化:CopyPaste數據增廣策略;
★識別模型優化:LCNet輕量級骨幹網絡;
★識別模型優化:UDML 改進知識蒸餾策略;
★識別模型優化:Enhanced CTC loss損失函數改進。
★在模型效果上,相對於PP-OCR mobile版本提升超7%;
★在速度上,相對於PP-OCR server版本提升超過220%;
★在模型大小上,11.6M的總大小,服務器端和移動端都可以輕鬆部署。
GitHub項目:
https://github.com/PaddlePaddle/PaddleOCR
Arxiv文章地址:
https://arxiv.org/abs/2109.03144