鏈接:https://pan.baidu.com/s/1l2yiba7ZTPUTf41ZnJ4PYw
提取碼:t3bq
win10安裝tesserocr
首先需要下載tesseract,它為tesserocr提供底層支持。具體下載官方路徑:https://github.com/UB-Mannheim/tesseract/wiki,選擇對應的系統版本,可以選擇一個相對不帶dev的穩定版本下載,如:tesseract-ocr-setup-3.05.02-20180621.exe。然后一路安裝,唯一記得勾選Additional language data(download),勾選可能會用到的語言tessdata,如簡體、繁體中文,數學模塊等,不需要全選,下載tessdata的時間會比較長。
下載時間會比較長,耐心等待即可,有條件可以翻墻下載速度會快很多
安裝python對應的tesserocr庫
使用原始的whl文件方式安裝。tesserocr 的whl官方文件下載路徑:https://github.com/simonflueckiger/tesserocr-windows_build/releases,下載本地環境對應的whl文件,如我的是window64位系統,python版本是3.5。下載完后,使用cd跳轉到whl文件所在目錄,然后 執行 ”pip install tesserocr-2.2.2-cp35-cp35m-win_amd64.whl“,即可輕松完成安裝。
tesserocr 報錯 UnicodeDecodeError 系統問題 用下面的模塊替代
pytesseract :pip install pytesseract
pip install pytesseract
首次運行總是不順利,相信我遇到的坑大多數人都會遇到,大抵錯誤類似:
1
2
3
4
|
Traceback (most recent call last): File "G:\pythonSources\my12306/obtain_message\test.py" , line 4 , in <module> print (tesserocr.image_to_text(image)) File "tesserocr.pyx" , line 2400 , in tesserocr._tesserocr.image_to_text RuntimeError: Failed to init API, possibly an invalid tessdata path: “本地某個路徑” |
有個比較簡單粗暴的解決方法是把安裝好的Tesseract-OCR下的tessdata文件夾整個拷貝到提示的那個路徑中,親測有效。
測試代碼
1
2
3
4
|
import tesserocr from PIL import Image image=Image.open('image.jpg') print(tesserocr.image_to_text(image)) |
總結
以上所述是小編給大家介紹的win10安裝tesserocr配置 Python使用tesserocr識別字母數字驗證碼,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對服務器之家網站的支持!
如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!
原文鏈接:https://blog.csdn.net/qq_38154948/article/details/103988080