python识别验证码

在做自动化测试时,遇到系统登录页面中有验证码的情况,可以让开发人员暂时去掉验证码,也可以做个简单的验证码识别脚本。虽然这个别识率不是很高,但也值得学习一下。

1,安装PIL库

用 pip install PIL 安装,如果失败,可以下载安装包

下载地址:http://www.pythonware.com/products/pil/

注意PIL库仅支持python2。如果是python3,则安装pillow库,可以用pip install Pillow 直接安装。


2,安装tesseract-ocr

下载地址:https://github.com/tesseract-ocr/tesseract/wiki/4.0-with-LSTM#400-alpha-for-windows

下载三个文件:

tesseract.exe , liblept177.dll , libtesseract400.dll

安装 tesseract.exe即可,安装完后验证一下安装是否成功,在CMD窗口执行

tesseract  -v

3.png

3,安装pytessract

直接用 pip install pytesseract安装


4,将一张验证码图片保存下来,然后验证下是否能识别,比如我的验证码图片保存到D盘。

# -*- coding: utf-8 -*-
from pytesseract import image_to_string
from PIL import Image
img = Image.open(r'd:\\aaa111.jpg')
# print(img)
print(image_to_string(img))

4.png

试了张图后,发现绝大多数是可以识别的,也存在一两张识别出错的情况。


该文章对你有帮助吗,求分享转发: 分享到QQ空间 分享给QQ好友

 

 

粤ICP备19116230号
友情链接: 码农藏书阁 天天链