ocr

1/4ページ

Python爬蟲之從網站圖片中抓取文字

  本程式採用selenium和phantomjs爬取亞馬遜圖書詳情頁面,並且使用Tesseract OCR識別圖書大圖上的文字。   程式模擬了我們在瀏覽器上的操作過程。點選下方會觸發頁面的js彈出模態框,此時頁面的dom會增加,然後點選模態框右邊的圖片可以進行切換,模態框上左邊的圖片會跟著進行變 […]

【翻譯】EAST: An Efficient and Accurate Scene Text Detector

EAST: An Efficient and Accurate Scene Text Detector 論文地址 概要 以前的場景文字檢測方法已經在各種基準上取得了有希望的表現。然而,即使配備深層神經網路模型,它們通常不擅長處理具有挑戰性的場景,因為整體效能由管道中多個階段和元件的相互作用決定。在這 […]

【筆記】【微信OCR(2):深度序列學習助力文字識別】

1 基於字元分割 字元識別 1.1 方法 首先切分到單字,識別單字的類別,然後將識別結果串聯起來。這種化整為零的方法是OCR在深度學習出現之前的幾十年裡通用的方法。 1.2 問題 這個方法有兩個明顯的弊端:1. 切分錯誤會影響識別效能;2. 單字識別未能考慮上下文資訊。 1.3 改進 為了彌補這兩點 […]