验证码在哪里找(短信验证码在哪里找)

工作中,如何用python和selenium提取验证码呢?

获取验证码的方法

按照以往的经验,有4种方法:

  1. 让开发帮忙去掉验证码代码,重新部署环境
  2. 弄个万能验证码,每次登陆都可以登陆
  3. 用cookie添加登录名和密码避开验证码的方式
  4. 老老实实获取验证码图片,识别出验证码

方法一:

遇到好说话的开发,他一般都能帮忙去掉验证码的代码。

但是代码去掉了,还需要重新部署一套没验证码的环境,麻烦,不推荐。

方法二:

还是需要开发的帮助,弄一个万能验证码,但测试环境弄的万能验证码可千万不能搞到正式环境。

故不推荐,还是先想想别的办法。

方法三:

该方法的难点是:如何在cookie中找到登陆用户名和密码的name,再将用户名和密码添加进去。

方法四:

最容易想到的办法,重点讲这个方法,此处有2个思路。

  1. 截图登陆页面,再截取验证码图片,识别;
  2. 直接在登陆页面,定位到验证码,将验证码图片另存为,识别;

该方法实现过程中,用到第三方库pytesseract,所以先安装需要引用的库。

验证码在哪里找(短信验证码在哪里找)

pytesseract的安装

pytesseract依赖于tesseract,需要先安装tesseract。

安装Tesseract模块:

git文档地址:https://digi.bib.uni-mannheim.de/tesseract/

请安装不带dev的稳定版,下载后就是一个exe安装包,直接右击安装即可。

一般安装在默认路径,如果不在默认路径,请记住该路径。

下载培训数据:

需要下载相应的培训数据,直接下载整个zip文件,解压后将文件复制到’tessdata‘目录中。

一般为:C:Program Files (x86)Tesseract-OCRtessdata

验证码在哪里找(短信验证码在哪里找)

配置环境变量:

  1. 编辑系统变量里面 path,添加安装路径:C:Program Files (x86)Tesseract-OCR
  2. 添加TESSDATA_PREFIX变量,值为:C:Program Files (x86)Tesseract-OCRtessdata
  3. 最后,在cmd命令模式下测试是否安装成功:
  4. tesseract test.jpg text -l chi_sim

安装python的第三方库: 

pip install pillow #一个python的图像处理库,pytesseract依赖

pip install pytesseract

修改pytesseract.py文件:

找到pytesseract的安装包,C:Python34Libsite-packagespytesseract。

编辑pytesseract.py文件,该步骤必须做,不然编译时会报错。

修改内容如下:

tesseract_cmd = ‘C:/Program Files (x86)/Tesseract-OCR/tesseract.exe’

验证码在哪里找(短信验证码在哪里找)

代码实现

上面讲述了实现的2种思路,现在分别说明代码实现过程。

思路一:

  1. 先计算浏览器与登陆页面截图的比例值
  2. 再计算对应的验证码图片位置
  3. 再将获取到的验证码图片,先进行二值化处理
  4. 处理后的图像采用pytesseract库转化
验证码在哪里找(短信验证码在哪里找)

截图保存验证码

验证码在哪里找(短信验证码在哪里找)

二值化处理验证码图片

验证码在哪里找(短信验证码在哪里找)

验证码图片转化

上述图片转化过程中,注意参数设置。

不设置参数时,总是将1转化为7,设置后转化准确率杠杠滴。

当然,目前只是识别数字型的验证码,文字类型的方法应该是类似的。

思路二:

  1. 先定位到验证码的位置
  2. 将验证码图片另存到一个路径
  3. 该路径下获取最新的验证码图片
  4. 验证码图片二值化处理
  5. 处理后的图像采用pytesseract库转化
验证码在哪里找(短信验证码在哪里找)

验证码另存为图片

后面的图片处理和获取验证码过程与思路一相同。

本文部分内容来自互联网,如有疑问请与我们联系。

发布者:币侠财经,转转请注明出处:https://www.yfhhf.com/baike/156928.html

(0)
                       
上一篇 2023年 2月 26日 下午6:17
下一篇 2023年 2月 26日 下午6:31

相关推荐

  • 好分数网查成绩入口(好分数网查成绩入口教师版)

    “送儿子上北大 店铺歇业,喜糖自取” 还记得 在自家鸡蛋灌饼店门口 挂出横幅的彭爸爸吗 他家的小儿子彭翔宇 今年17岁 被北京大学工学院录取 网友羡慕表示:这个歇业通知真豪横! 隔着屏幕 都能感受到父母的骄傲! 彭爸爸又来北大了 他受邀参加 北京大学2022国庆校园美食文化节 化身为彭师傅 将家乡美食——鸡蛋灌饼 带到北大农园食堂 美食节期间, 彭师傅将鸡蛋…

    2022年 11月 15日
    1600
  • 安徽中考几号(安徽中考几号出成绩)

    前段时间有很多朋友都想知道安徽中考几号是什么。今天小编特意为大家整理了相关知识来解答!还有其他网友想搞清楚安徽中考几号出成绩,币侠网小编(www.yfhhf.com)现在为大家找到了相关问题的答案,接下来一起看看吧,希望能给大家带来帮助。 今晚,安徽省教育厅发布通知,确定今年中考时间为7月14日-16日。 此外初中学业水平体育与健康学科考试(九年级)不再设必…

    2022年 10月 23日
    1560
  • 合肥师范学院是二本还是一本(合肥师范学院是二本还是一本2021)

    合肥师范学院锦绣校区大门 自从合肥学院整体一本之后,合肥师范学院的招生分数线一直都是安徽省二本高校中名列前茅的,近几年,该校文理科二本分数线都是安徽省二本高校第一名!此外,该校还有11个一本招生专业,并且均为师范专业。 虽然合肥师范学院在2007年才升格为本科高校,但是,该校发展的很快,该校于2009年才拿到学士学位授权资格,但是,该校在2011年就拿到了招…

    2022年 12月 27日
    1440
  • 凯迪拉克品牌档次排名(凯迪拉克品牌档次排名榜)

    前段时间有很多朋友都想知道凯迪拉克品牌档次排名是什么。今天小编特意为大家整理了相关知识来解答!还有其他网友想搞清楚凯迪拉克品牌档次排名榜,币侠网小编(www.yfhhf.com)现在为大家找到了相关问题的答案,接下来一起看看吧,希望能给大家带来帮助。 随着市场选择性越来越丰富,消费者购车时考虑的因素也会越来越全面,设计、配置、空间、性能、档次感等等,不过最为…

    2022年 9月 23日
    3530
  • 慧的拼音和组词(慧的拼音和组词怎么写的)

    形近字组词:淘气 葡萄 牵手 监牢 天鹅 俄国 卵石 印象 填补 镇压 村庄 压力 庄稼 嫁接 通俗 洗浴 飞跃 妖怪 葡萄 蒲草 多音字识别: 间; [ jiān ] 时间 、人间, [ jiàn ] 间隔、离间计 阿: [ ā ] 阿姨 、阿爸 、阿妈,[ ē ] 阿胶、阿谀奉承 载: [ zǎi ] 三年两载、千载难逢、刊载、下载 、转载, [ zài…

    2023年 5月 19日
    1420

联系我们

不接风险内容

在线咨询: QQ交谈

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信