盘点一个Python网络爬虫过验证码的问题（方法一）

首页 > 财经 > > 正文

2023-06-24 08:33:14 程序员客栈

点击上方“Python爬虫与数据挖掘”，进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

今

(相关资料图)

日

鸡

汤

低眉信手续续弹，说尽心中无限事。

大家好，我是皮皮。

一、前言

前几天在Python最强王者群【鶏啊鶏。】问了一个Python网络爬虫的问题，这里拿出来给大家分享下。

下面是他的代码：

from selenium import webdriverfrom selenium.webdriver.common.by import Byimport timefrom PIL import Imageimport ddddocrocr = ddddocr.DdddOcr()options = webdriver.ChromeOptions()options.add_argument("user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36")options.add_argument("--disable-blink-features=AutomationControlled")driver = webdriver.Chrome(options=options)# 打开目标网页driver.get("https://sol.sinosure.com.cn")time.sleep(5)driver.maximize_window()# 定位验证码图片元素并模拟鼠标悬停以加载图片yanzhengma = driver.find_element(By.CSS_SELECTOR, ".pass-form-item.pass-form-item-code")captcha_element = yanzhengma.find_element(By.CSS_SELECTOR,  ".pass-label-img")webdriver.ActionChains(driver).move_to_element(captcha_element).perform()time.sleep(5)# 获取验证码图片元素的位置和大小location = captcha_element.locationsize = captcha_element.sizeprint(location)print(size)# 截取整个网页的截图driver.save_screenshot("screenshot.png")# 根据验证码图片元素的位置和大小，从整个网页截图中裁剪出验证码图片left = int(location["x"])top = int(location["y"])right = int(location["x"] + size["width"])bottom = int(location["y"] + size["height"])captcha_screenshot = Image.open("screenshot.png").crop((left, top, right, bottom))print(left)print(top)print(location)print(bottom)# 保存裁剪后的验证码图片，并进行识别captcha_screenshot.save("captcha.png")with open("captcha.png", "rb") as f:    img_bytes = f.read()res = ocr.classification(img_bytes)print("识别的验证码是：" + res)

基本思路是没啥问题的，确实也是可以拿到对应界面的截图，只不过是验证码的位置截取出现了点偏差，导致验证码没正确识别到。

下面这个代码是获取验证码图片元素的位置和大小：

location = captcha_element.locationsize = captcha_element.size

这个部分我看介绍应该是会返回定位的元素位置，我刚刚大致拖拉了一下在裁剪前的定位打印出来确实就已经去了输入密码附近的位置了但是我定位的元素是验证码的地方，并且我也尝试了先定位验证那个位置的大元素再定位至具体的验证码图片位置问题依旧。

上面是粉丝的疑惑，下面一起来看看解决办法。

二、实现过程

这里【魏哥】尝试了下代码，但是出现下图报错：

这个报错还是蛮常见的，对于时常使用sel的人来说，这个报错算是家常便饭了，报错的原因是本地浏览器驱动和谷歌浏览器的版本不匹配，需要更换本地浏览器驱动。

关于这个问题的解决方法，就是去网页下载对应浏览器版本的对应驱动，放到本地指定文件夹，确保该文件夹路径有加入环境变量。该问题的解决办法公众号历史文章也有提及，网上的解决教程也一大堆，这里不再赘述。

言归正传，继续回到这个问题的解决办法。这里【甯同学】给了一个思路，直接找到验证码的图片的url 用requests 请求验证码的.content 用 ocr.classification(验证码的.content) 就可以了不用保存图片在open读取二进制流，代码如下所示：

顺利地解决了粉丝的问题，如果对requests和Beautiful还不熟悉的小伙伴，可能接受起来就比较困难一些。

这里只是给出了其中一个方法，另外的一个方法，一起看下一篇文章，敬请期待！

三、总结

大家好，我是皮皮。这篇文章主要盘点了一个Python网络爬虫过验证码的问题，文中针对该问题，给出了具体的解析和代码实现，帮助粉丝顺利解决了问题。

最后感谢粉丝【鶏啊鶏】提问，感谢【甯同学】、【魏哥】给出的思路和代码解析，感谢【Ineverleft】等人参与学习交流。

【提问补充】温馨提示，大家在群里提问的时候。可以注意下面几点：如果涉及到大文件数据，可以数据脱敏后，发点demo数据来（小文件的意思），然后贴点代码（可以复制的那种），记得发报错截图（截全）。代码不多的话，直接发代码文字即可，代码超过50行这样的话，发个.py文件就行。

大家在学习过程中如果有遇到问题，欢迎随时联系我解决（我的微信：pdcfighting1），应粉丝要求，我创建了一些高质量的Python付费学习交流群和付费接单群，欢迎大家加入我的Python学习交流群和接单群！

小伙伴们，快快用实践一下吧！如果在学习过程中，有遇到任何问题，欢迎加我好友，我拉你进Python学习交流群共同探讨学习。

------------------- End -------------------

往期精彩文章推荐：

if a and b and c and d：这种代码有优雅的写法吗？

Pycharm和Python到底啥关系？

都说chatGPT编程怎么怎么厉害，今天试了一下，有个静态网页，chatGPT居然没搞定？

站不住就准备加仓，这个pandas语句该咋写？

欢迎大家点赞，留言，转发，转载，感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群】

万水千山总是情，点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

北京工业大学揭牌新研究院|天天速读

兴义市特殊教育学校开展“平安校园 文明先行”党员志愿者服务活动 环球消息

7月1日起，南宁去香港更快了！广西新增多趟动车…-天天速看料

重组预案披露前连续涨停遭问询 日播时尚回复称不存在内幕信息泄露情况

当前热讯：多口鱼塘鱼儿莫名死亡 村民们怀疑与上游水库清淤有关？

环球看热讯：微信没钱了怎么充值 微信里面没钱怎么充值

揭秘背后的故事！广西壮族天琴表演为何能登上央视端午特别节目_每日精选

【中国好手艺83】关东内画讲述人：吉林省级非物质文化遗产项目关东内画代表性传承人王秋清

不到两个月！深交所首次启动这项差异化监管安排 含现场督导、专项自查！以后每半年来一次

复盘“6·18”：GMV隐身内容电商地位提升

海贼王1086话：萨博战败体现了革命军实力太弱，龙还得靠贝加庞克 每日速讯

送女生什么礼物最通用？教你如何绘制滑雪板，带她体验不一样的冬季乐趣！

环球速递！探访银川烧烤店爆炸事发区域：工作人员遗憾苗头未引起重视

损失或超100亿元！中国新能源企业又被印度人坑了 全球速看料

环球今头条！大鹏新区基层“理论宣讲家”评选总决赛收官，获奖名单出炉

焦点报道:分析称京东在618购物节期间的销售额超出预期

环球今头条！记者：皇马内部很多人相信姆巴佩今年会加盟，球员本人不着急

微软CEO与多位Xbox高管将出庭为FTC收购案辩护

抖音618战报：整体销量同比增66% 天天观点

当前快看：新消息丨当前时讯：当前报道:每日时讯!世界热头条丨焦点讯息：当前快讯:在淄博，寻觅陶风瓷韵 世界热点评 快资讯_天天即时看-快看|天天精选 全球观察 今日报 全球百事通-世界微速讯_热闻_看点

全球报道:TB应用授权在哪里（淘宝应用授权干什么用）

世界热点评！年少不懂《狮子王》，读懂已是中年人……

世界今亮点！韩网热议EDG不敌RNG：自从Leave离开，Uzi加入后，EDG水平变很差

重要提示！家有燃气的赶紧看！

端午期间 酉阳推出多项主题活动

每日动态!6月21日涤纶POY为7565.00

【世界报资讯】闲鱼用户超五亿，爱回收连续三个季度盈利，二手电商讲出了新故事？

全球快看点丨财富暴增570亿美元，大佬怎么做到的？

古代城池，为什么不能绕过去_每日短讯

【世界聚看点】队记：湖人将优先考虑未来而非目前的窗口 克里斯蒂是非卖品

陈根：人体粪便可预测痴呆风险

什么成语可以用“泵”来形容？

新股消息丨贝克微电子递表港交所 为中国最大的模拟IC图案晶圆提供商_全球微动态

黟县人社局 人社综窗再升级，政务服务展新颜_全球聚看点

广州海珠上线电动自行车充电地图 一键导航充电点

红警修改器怎么用 红警修改大师使用教程（红警2修改器怎么用）

今日聚焦!龟兹乐器指的是什么（龟兹乐器）

天天新消息丨上海将新添一座深度处理水厂：采用臭氧+生物活性炭工艺

天天关注：联赛陷入降级区 北京女足期待再次“绽放”

江湖悠悠怎么筹备宴会 江湖悠悠宴会筹备攻略 每日速读

端午假期民航日均运输旅客较2019年同期增长11.5%

安图生物近日获得医疗器械注册证

我的世界组件怎么用（我的世界组件怎么用网易我的世界手游组件怎么用）

补贴、扩招、兜底……四川促进青年就业创业将有新措施—中国新闻网·四川新闻

广西贺州6月22日—26日将出现持续性暴雨天气_全球播资讯

竞争还是合作？国内快递业的“三国杀” 当前最新_焦点观察

距今2000多年！河南考古发现迄今为止国内最古老粽子|环球即时

全球快资讯丨回归现实主义创作失去英伦制造味道

全球今亮点！德鲁兹居民与以色列警方发生冲突 致多人受伤

鸡血藤怎么吃治疗闭经（鸡血藤怎么吃治疗闭经配方）

张帅遭遇巡回赛单打10连败，岁月不饶人，到了退役的年龄了|快报

当前消息！滴滴出行九江同日收7罚单 因服务车辆未取得合法资质

【新视野】【DIMF 2023回顾】产品—主要机型（下）— 车削中心

湖南中医附一2023年端午节就诊提醒 全球讯息

招行信用卡中心电话邀请开卡 招行打电话办理信用卡我提交了申请

二七区：河南萌物大象奔奔受邀参加河南国际传播中心揭牌仪式 今日视点

雄心壮志！CAR-T疗法大发光芒，全球市值破200亿，中国角逐百亿战场！这些公司已暗自握拳 聚看点

主题教育市委巡回指导十三组推动所指导单位务实调研，以实干破难题、解民忧——为了这场座谈会 指导组下沉走访半个月

“救命神器”在身边 AED设备首进社区

小菜园、亲子角…新华社区这些“微项目”，居民将参与打造 世界快消息

理想汽车销量太猛！狂卖1.98万辆，理想6月上半月销量公布 天天观天下

秦皇岛积极打造“帆船之城”品牌

新房成交近5年新低，二手房挂牌近12万套，这座万亿GDP大城楼市怎么了？

汉威科技集团与兴港燃气优势互补，共筑安全防线

全球视讯！IDC报告发布 安恒信息工业互联网安全管理平台力拔头筹

减税降费、扩大开放综合试点！我国服务业今年实现较快增长

驻马店市生态环境局泌阳分局多措并举做好汛期断面水质监管工作|当前快讯

就在明天！青岛市首届龙舟文化节暨青岛市第五届龙舟赛高新区竞渡-环球精选

头条焦点：赛龙舟、包粽子......各地如何过端午？热闹场面来啦

中国公民在奥克兰遇袭 中驻奥总领馆向奥市政厅表达关切

环球微动态丨世界实时：每日速读!资讯：环球聚焦：每日观察!感动一年级作文500字-环球看点-环球短讯|全球观天下-即时看-全球速读-当前要闻-全球热文 短讯

“爱心园丁”播种生命希望

拜年彩信图片_拜年彩信

查书pdf_查书网_环球要闻

热门中概股多数下跌 虎牙、小鹏汽车跌超6%

2023爱国卫生宣传周倡议书精选模板|环球焦点

蔚来手机即将发布：主打高端 无广告

世界看点：广州发布雷雨天气提示：天河区、越秀区将有雷雨

当前看点!我国将在各地建设农民工工资争议速裁庭

天天资讯：科学家发现河蚌铰链脆性成分中的抗疲劳结构

兴义市特殊教育学校开展“平安校园文明先行”党员志愿者服务活动环球消息

重组预案披露前连续涨停遭问询日播时尚回复称不存在内幕信息泄露情况

当前热讯：多口鱼塘鱼儿莫名死亡村民们怀疑与上游水库清淤有关？

环球看热讯：微信没钱了怎么充值微信里面没钱怎么充值

不到两个月！深交所首次启动这项差异化监管安排含现场督导、专项自查！以后每半年来一次

海贼王1086话：萨博战败体现了革命军实力太弱，龙还得靠贝加庞克每日速讯

损失或超100亿元！中国新能源企业又被印度人坑了全球速看料

当前快看：新消息丨当前时讯：当前报道:每日时讯!世界热头条丨焦点讯息：当前快讯:在淄博，寻觅陶风瓷韵世界热点评快资讯_天天即时看-快看|天天精选全球观察今日报全球百事通-世界微速讯_热闻_看点

端午期间酉阳推出多项主题活动

【世界聚看点】队记：湖人将优先考虑未来而非目前的窗口克里斯蒂是非卖品

新股消息丨贝克微电子递表港交所为中国最大的模拟IC图案晶圆提供商_全球微动态

黟县人社局人社综窗再升级，政务服务展新颜_全球聚看点

广州海珠上线电动自行车充电地图一键导航充电点

红警修改器怎么用红警修改大师使用教程（红警2修改器怎么用）

天天关注：联赛陷入降级区北京女足期待再次“绽放”

江湖悠悠怎么筹备宴会江湖悠悠宴会筹备攻略每日速读

全球今亮点！德鲁兹居民与以色列警方发生冲突致多人受伤

当前消息！滴滴出行九江同日收7罚单因服务车辆未取得合法资质

湖南中医附一2023年端午节就诊提醒全球讯息

招行信用卡中心电话邀请开卡招行打电话办理信用卡我提交了申请

二七区：河南萌物大象奔奔受邀参加河南国际传播中心揭牌仪式今日视点

雄心壮志！CAR-T疗法大发光芒，全球市值破200亿，中国角逐百亿战场！这些公司已暗自握拳聚看点

主题教育市委巡回指导十三组推动所指导单位务实调研，以实干破难题、解民忧——为了这场座谈会指导组下沉走访半个月

小菜园、亲子角…新华社区这些“微项目”，居民将参与打造世界快消息

理想汽车销量太猛！狂卖1.98万辆，理想6月上半月销量公布天天观天下

全球视讯！IDC报告发布安恒信息工业互联网安全管理平台力拔头筹

中国公民在奥克兰遇袭中驻奥总领馆向奥市政厅表达关切

环球微动态丨世界实时：每日速读!资讯：环球聚焦：每日观察!感动一年级作文500字-环球看点-环球短讯|全球观天下-即时看-全球速读-当前要闻-全球热文短讯

热门中概股多数下跌虎牙、小鹏汽车跌超6%

蔚来手机即将发布：主打高端无广告

最新整理！蚌埠部分中学发布特长生专项测试项目及评分标准

环球通讯！印度阿萨姆邦洪水加剧近50万人受灾

蜂蜜柠檬水保存方法蜂蜜柠檬水放保鲜还是冷藏

帕克：马刺需要在文班周围配置合适的球员才能让球队能够争冠

中国药材市场柏子仁价格中心_中国药材市场焦点精选

全球速讯：第070期大乐透晒票欣赏，空有一身热爱，却入不了这山海

兴义市特殊教育学校开展“平安校园文明先行”党员志愿者服务活动环球消息

每日快讯!【数据看盘】期指多头加仓量高于空头多股遭机构席位大笔净卖出

多地新增地方政府债务预算调整呈现差异化、精准化特征

ST三圣06月21日涨停分析环球滚动

重组预案披露前连续涨停遭问询日播时尚回复称不存在内幕信息泄露情况

当前热讯：多口鱼塘鱼儿莫名死亡村民们怀疑与上游水库清淤有关？

全球热头条丨美国各界：中美合作至关重要惠及全球

两世欢评价两世欢评价如何

玉米面怎么做好吃玉米面怎么做好吃?-天天快播

环球看热讯：微信没钱了怎么充值微信里面没钱怎么充值

天天热讯:萌系代表新手友好上汽大众ID.3试驾体验

西班牙喊渴：近四成领土干旱缺水，一些农场颗粒无收，居民限量用水全球视点

甘肃亚盛实业（集团）股份有限公司拟投资设立中药材公司，深度融入大健康领域全球播资讯

第三届全球饶商大会举行现场签约项目总额超300亿元

《秀我中国 | 新时代中国乡村志（第四集）：千年梯田十年新生》聚看点

江疏影身高对比赵薇_江疏影身高环球观察