吊打一切現有開源OCR項目:效果再升7%,速度提升220%

吊打一切現有開源OCR項目:效果再升7%,速度提升220%

吊打一切現有開源OCR項目:效果再升7%,速度提升220%


資料來源: https://mp.weixin.qq.com/s/mMWXxoIXg2IO5Bc2VxQRVw


    OCR方向的工程師,之前一定聽說過PaddleOCR這個項目,其主要推薦的PP-OCR算法更是被國內外企業開發者廣泛應用,短短半年時間,頻頻登上Github Trending和Paperswithcode 日榜月榜第一,在《Github 2020數字洞察報告》中被評為稱它為最近,由PaddleOCR原創團隊,針對PP-OCR進行了一些經驗性改進,構建了一種新的OCR系統,稱為PP-OCRv2。


★檢測模型優化:採用CML協同互學習知識蒸餾策略;

★檢測模型優化:CopyPaste數據增廣策略;

★識別模型優化:LCNet輕量級骨幹網絡;

★識別模型優化:UDML 改進知識蒸餾策略;

★識別模型優化:Enhanced CTC loss損失函數改進。

★在模型效果上,相對於PP-OCR mobile版本提升超7%;

★在速度上,相對於PP-OCR server版本提升超過220%;

★在模型大小上,11.6M的總大小,服務器端和移動端都可以輕鬆部署。


GitHub項目:

        https://github.com/PaddlePaddle/PaddleOCR

Arxiv文章地址:

        https://arxiv.org/abs/2109.03144


發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *