天天热推荐：盘点一个Python网络爬虫过验证码的问题（方法一）

首页 > 资讯 > > 正文

2023-06-23 21:12:44 程序员客栈

点击上方“Python爬虫与数据挖掘”，进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

(资料图)

今

日

鸡

汤

低眉信手续续弹，说尽心中无限事。

大家好，我是皮皮。

一、前言

前几天在Python最强王者群【鶏啊鶏。】问了一个Python网络爬虫的问题，这里拿出来给大家分享下。

下面是他的代码：

from selenium import webdriverfrom selenium.webdriver.common.by import Byimport timefrom PIL import Imageimport ddddocrocr = ddddocr.DdddOcr()options = webdriver.ChromeOptions()options.add_argument("user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36")options.add_argument("--disable-blink-features=AutomationControlled")driver = webdriver.Chrome(options=options)# 打开目标网页driver.get("https://sol.sinosure.com.cn")time.sleep(5)driver.maximize_window()# 定位验证码图片元素并模拟鼠标悬停以加载图片yanzhengma = driver.find_element(By.CSS_SELECTOR, ".pass-form-item.pass-form-item-code")captcha_element = yanzhengma.find_element(By.CSS_SELECTOR,  ".pass-label-img")webdriver.ActionChains(driver).move_to_element(captcha_element).perform()time.sleep(5)# 获取验证码图片元素的位置和大小location = captcha_element.locationsize = captcha_element.sizeprint(location)print(size)# 截取整个网页的截图driver.save_screenshot("screenshot.png")# 根据验证码图片元素的位置和大小，从整个网页截图中裁剪出验证码图片left = int(location["x"])top = int(location["y"])right = int(location["x"] + size["width"])bottom = int(location["y"] + size["height"])captcha_screenshot = Image.open("screenshot.png").crop((left, top, right, bottom))print(left)print(top)print(location)print(bottom)# 保存裁剪后的验证码图片，并进行识别captcha_screenshot.save("captcha.png")with open("captcha.png", "rb") as f:    img_bytes = f.read()res = ocr.classification(img_bytes)print("识别的验证码是：" + res)

基本思路是没啥问题的，确实也是可以拿到对应界面的截图，只不过是验证码的位置截取出现了点偏差，导致验证码没正确识别到。

下面这个代码是获取验证码图片元素的位置和大小：

location = captcha_element.locationsize = captcha_element.size

这个部分我看介绍应该是会返回定位的元素位置，我刚刚大致拖拉了一下在裁剪前的定位打印出来确实就已经去了输入密码附近的位置了但是我定位的元素是验证码的地方，并且我也尝试了先定位验证那个位置的大元素再定位至具体的验证码图片位置问题依旧。

上面是粉丝的疑惑，下面一起来看看解决办法。

二、实现过程

这里【魏哥】尝试了下代码，但是出现下图报错：

这个报错还是蛮常见的，对于时常使用sel的人来说，这个报错算是家常便饭了，报错的原因是本地浏览器驱动和谷歌浏览器的版本不匹配，需要更换本地浏览器驱动。

关于这个问题的解决方法，就是去网页下载对应浏览器版本的对应驱动，放到本地指定文件夹，确保该文件夹路径有加入环境变量。该问题的解决办法公众号历史文章也有提及，网上的解决教程也一大堆，这里不再赘述。

言归正传，继续回到这个问题的解决办法。这里【甯同学】给了一个思路，直接找到验证码的图片的url 用requests 请求验证码的.content 用 ocr.classification(验证码的.content) 就可以了不用保存图片在open读取二进制流，代码如下所示：

顺利地解决了粉丝的问题，如果对requests和Beautiful还不熟悉的小伙伴，可能接受起来就比较困难一些。

这里只是给出了其中一个方法，另外的一个方法，一起看下一篇文章，敬请期待！

三、总结

大家好，我是皮皮。这篇文章主要盘点了一个Python网络爬虫过验证码的问题，文中针对该问题，给出了具体的解析和代码实现，帮助粉丝顺利解决了问题。

最后感谢粉丝【鶏啊鶏】提问，感谢【甯同学】、【魏哥】给出的思路和代码解析，感谢【Ineverleft】等人参与学习交流。

【提问补充】温馨提示，大家在群里提问的时候。可以注意下面几点：如果涉及到大文件数据，可以数据脱敏后，发点demo数据来（小文件的意思），然后贴点代码（可以复制的那种），记得发报错截图（截全）。代码不多的话，直接发代码文字即可，代码超过50行这样的话，发个.py文件就行。

大家在学习过程中如果有遇到问题，欢迎随时联系我解决（我的微信：pdcfighting1），应粉丝要求，我创建了一些高质量的Python付费学习交流群和付费接单群，欢迎大家加入我的Python学习交流群和接单群！

小伙伴们，快快用实践一下吧！如果在学习过程中，有遇到任何问题，欢迎加我好友，我拉你进Python学习交流群共同探讨学习。

------------------- End -------------------

往期精彩文章推荐：

if a and b and c and d：这种代码有优雅的写法吗？

Pycharm和Python到底啥关系？

都说chatGPT编程怎么怎么厉害，今天试了一下，有个静态网页，chatGPT居然没搞定？

站不住就准备加仓，这个pandas语句该咋写？

欢迎大家点赞，留言，转发，转载，感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群】

万水千山总是情，点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

安全生产宣传 筑牢安全防线——金水区东风路街道开展安全生产宣传活动

第54届巴黎航展举行 中国企业拿出亮眼参展清单_微速讯

上海迪士尼可以带水果进去吗2023

记者：津门虎4名外援以及王秋明、明天、巴顿未随队出战足协杯

环球速讯：运动时穿暴汗服对身体有影响吗

镇平县侯集镇多措并举推动防返贫监测集中排查工作走深走实 信息

当前关注：抢钱俱乐部：黄金穷寇莫追，1910区域做多先看反弹力度！

哈尔滨地铁端午节期间全力保障广大市民安全出行_即时看

香港屯门45岁男子村屋内身亡，胸口中刀！已交由重案组跟进-头条

【全球报资讯】你知道，人类的屁股有多特殊吗？在生物界属于仅有

全球热点！端午假期，对不健康饮食说“不”！

Win11最近一个月卡爆了！CPU占用高元凶终于找到：微软认错_世界热点

哇哦，迪卡侬造车了！！！

取消就业报到证 人社部门提示毕业生转档要点

手机gps定位在哪里查看

家里万万不要装这种衣柜了，我家当初不懂没听劝，入住就知缺点多

这些手相的人桃花运不断，但感情却并不顺利，谈得多不容易成功！

中建二局举办粤港澳大湾区建设劳动和技能竞赛总结推进会

梅州举行百人诗会 110余名粤赣闽三省诗朋文友齐聚蕉岭

致欧科技上市首日总市值106亿元 仍面临业绩下滑、研发不足等问题

天天快资讯：汉口滨江国际商务区掀起建设高潮

向往的专业第7期|临床医学类专业：选择做一名好医生

国家铁路局：全国铁路5月完成旅客发送量同比增长252.9%-焦点速递

五部门联合开展2023年青少年科学调查体验活动

贷款市场报价利率下调降低实体经济融资成本 激发有效融资需求

星之破晓英雄有哪些 星之破晓英雄介绍大全-环球即时

公牛集团实控人之一阮学平拟减持不超1779万股 占总股本2% 当前观察

实时：葛斯齐曝药贩子和大小S找中间人交易，此人姓黄是男性艺人

世界观点：澜起科技： 随着支持DDR5的主流CPU平台的陆续上市，DDR5的渗透率将逐步提高

天天看热讯：硬核科技论丨从概念到现实 车外后视镜大变革即将到来（下）

再获胜利！主场取得两连胜，国足顺利起步

协创数据：接受紫筹投资调研

618复盘|折叠屏销量激增，但手机大盘难回巅峰时代_全球新消息

图知道｜ 中美五项共识涉及哪些重要内容 焦点简讯

清新启动防汛Ⅳ级应急响应

徐州市公积金中心通告：暂停办理 今日热搜

电影《消失的她》票房领跑端午档，朱一龙倪妮揭秘重头戏幕后 今日观点

泰山石油：与国网电动汽车、泰安供电公司签订战略合作协议

广南(集团)获授予5.5亿港元的定期贷款融资 天天资讯

全球快报:腾讯《王者荣耀》5月狂赚17亿元、米哈游紧随其后

全球即时：运机集团股东户数下降5.47%，户均持股10.42万元

揭博高速河源段多点发力，推进“安全生产月”活动走深走实

今日报丨安逸四川日历海报丨青衣江畔百舟竞渡

6699元！华硕2023新款电竞主机降价，鲁大师得分超150万分

松炀资源：6月20日公司高管王卫龙减持公司股份合计8.75万股 全球通讯

划“粽”点！端午节，就要仪式感满满~

垃圾分类的小妙招三条-每日播报

【世界新视野】球迷欢呼！10冠王费德勒重游哈雷赛，再拿一座奖杯，恭喜瑞士天王！

港股异动 | 中国建筑国际(03311)午后涨超5% 中金预计公司下半年起实现盈利较快增长|热讯

做不了主播的薇娅雪梨，干了同一件事 天天热推荐

辽宁省庄河市发生一起命案致6人死亡 警方通报

衡阳、岳阳、益阳、怀化多名干部被点名通报！

南京高淳：群“龙”竞渡古胥河

海南共和：青少年模拟法庭有声有色

万亿级机会清单发布！一大批重大项目开工！ 世界观热点

动视公司在推出仅 3 年后就关闭了原版《使命召唤：战区》-焦点热闻

女足世界杯赛程敲定 中国女足全力展现最好自我-当前热议

2023端午档票房破5亿

端午到，网上感受文化魅力

当前消息！同花顺远航版和免费版

黄瓜凉拌豆腐皮的简单做法_凉拌豆腐皮的简单做法 全球热资讯

全球快报:宋易元吉猴猫图卷

全球速读：怎么申请注册抖音号 申请注册抖音号的申请表

天天即时看！【有事找紫牛】有人私自倾倒工业废料？记者调查：系营养土半成品 ，堆场将取缔

焦点讯息：90岁老战士与90后飞行员同框 不同的时代，同一种信仰！！

环球热点评！2-0！大连人全主力磕下中甲老七！曼佐基头球顶到了水坑里，宝石真香

天天资讯：业内人士解读银川烧烤店爆炸事件：空气中液化气达到多少易发生爆炸？如何预防？

欧洲E级超算将落户法国 全球即时

股市[超话]周五股市大跌的根本逻辑，好多人没看懂，

环球实时：「组图」航拍尼山圣境：朝阳映照尽显儒风

邢台广宗：情系端午节 爱在敬老院-今日关注

bs机是什么意思_bs是什么意思

全球今日报丨传承人文力量 涵养家国情怀——多地群众端午节庆扫描

长实称已取得Civitas Social Housing逾64%已发行股份 收购代价约48亿港元 当前播报

雷蛇推出Razer Skins 贴纸：涵盖Xbox / Playstation / Switch-全球快报

当前消息！关注公共安全，全国首个县级特种设备安全科普教育基地开馆

南钢股份： 该事项尚在进行中-资讯

全球即时：2023年阆中古城第五届嘉陵江龙舟赛开赛

天天观速讯丨俄外长：在俄罗斯积极协助下 非盟加入G20问题将于近期得到解决

董路炮轰村超无用！贵州官媒回击心别黑，范志毅最新表态一针见血 热头条

安全生产宣传筑牢安全防线——金水区东风路街道开展安全生产宣传活动

第54届巴黎航展举行中国企业拿出亮眼参展清单_微速讯

镇平县侯集镇多措并举推动防返贫监测集中排查工作走深走实信息

取消就业报到证人社部门提示毕业生转档要点

致欧科技上市首日总市值106亿元仍面临业绩下滑、研发不足等问题

贷款市场报价利率下调降低实体经济融资成本激发有效融资需求

星之破晓英雄有哪些星之破晓英雄介绍大全-环球即时

公牛集团实控人之一阮学平拟减持不超1779万股占总股本2% 当前观察

世界观点：澜起科技：随着支持DDR5的主流CPU平台的陆续上市，DDR5的渗透率将逐步提高

天天看热讯：硬核科技论丨从概念到现实车外后视镜大变革即将到来（下）

图知道｜中美五项共识涉及哪些重要内容焦点简讯

徐州市公积金中心通告：暂停办理今日热搜

电影《消失的她》票房领跑端午档，朱一龙倪妮揭秘重头戏幕后今日观点

广南(集团)获授予5.5亿港元的定期贷款融资天天资讯

松炀资源：6月20日公司高管王卫龙减持公司股份合计8.75万股全球通讯

做不了主播的薇娅雪梨，干了同一件事天天热推荐

辽宁省庄河市发生一起命案致6人死亡警方通报

万亿级机会清单发布！一大批重大项目开工！世界观热点

女足世界杯赛程敲定中国女足全力展现最好自我-当前热议

黄瓜凉拌豆腐皮的简单做法_凉拌豆腐皮的简单做法全球热资讯

全球速读：怎么申请注册抖音号申请注册抖音号的申请表

天天即时看！【有事找紫牛】有人私自倾倒工业废料？记者调查：系营养土半成品，堆场将取缔

焦点讯息：90岁老战士与90后飞行员同框不同的时代，同一种信仰！！

欧洲E级超算将落户法国全球即时

邢台广宗：情系端午节爱在敬老院-今日关注

全球今日报丨传承人文力量涵养家国情怀——多地群众端午节庆扫描

长实称已取得Civitas Social Housing逾64%已发行股份收购代价约48亿港元当前播报

南钢股份：该事项尚在进行中-资讯

天天观速讯丨俄外长：在俄罗斯积极协助下非盟加入G20问题将于近期得到解决

董路炮轰村超无用！贵州官媒回击心别黑，范志毅最新表态一针见血热头条

珠海市政府与协鑫集团签署合作框架协议推动储能电芯等产业项目合作

菲尔克鲁格：没想过和拜仁的绯闻难以反驳德国队沦为中流的说法天天新要闻

小米累计支付金额突破194亿元各厂商公布618大促战报关注

中年男人，在消费链底端全球快看点

安全生产宣传筑牢安全防线——金水区东风路街道开展安全生产宣传活动

兴业证券：首予中创新航增持评级目标价25.18港元

阳逻港换电站投用，机器人帮忙换电池环球快讯

第54届巴黎航展举行中国企业拿出亮眼参展清单_微速讯

焦点快报!热热热高温行车安全提示请收好

多家商超主动下架，它真的“凉”了？世界新要闻

这届年轻人，已经心甘情愿吃“剩菜”了世界焦点

全球速读：北京市教委：高温天气下合理调整学生室外活动时间根据实际情况采取减课或停课措施

赛力斯新能源汽车出海再加速 SERES 5开启欧洲首批交付播资讯

极地试炼开启！《英雄联盟手游》熊羊对决限时开放全球播资讯

世界消息！一心堂开店提速：新投近6000万并购曾称今年将拓展门店近2000家

《德国双元制高等教育2022》发布每日焦点

【环球新视野】北京市教委：在高温天气时学校不安排学生参加大型室外活动

苏丹武装冲突持续多地安全局势危急|环球精选