盘点一个Python网络爬虫过验证码的问题（方法一）|天天信息

首页 > 交通 > > 正文

2023-06-22 15:04:08 程序员客栈

点击上方“Python爬虫与数据挖掘”，进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

今

日

(相关资料图)

鸡

汤

低眉信手续续弹，说尽心中无限事。

大家好，我是皮皮。

一、前言

前几天在Python最强王者群【鶏啊鶏。】问了一个Python网络爬虫的问题，这里拿出来给大家分享下。

下面是他的代码：

from selenium import webdriverfrom selenium.webdriver.common.by import Byimport timefrom PIL import Imageimport ddddocrocr = ddddocr.DdddOcr()options = webdriver.ChromeOptions()options.add_argument("user-agent=Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36")options.add_argument("--disable-blink-features=AutomationControlled")driver = webdriver.Chrome(options=options)# 打开目标网页driver.get("https://sol.sinosure.com.cn")time.sleep(5)driver.maximize_window()# 定位验证码图片元素并模拟鼠标悬停以加载图片yanzhengma = driver.find_element(By.CSS_SELECTOR, ".pass-form-item.pass-form-item-code")captcha_element = yanzhengma.find_element(By.CSS_SELECTOR,  ".pass-label-img")webdriver.ActionChains(driver).move_to_element(captcha_element).perform()time.sleep(5)# 获取验证码图片元素的位置和大小location = captcha_element.locationsize = captcha_element.sizeprint(location)print(size)# 截取整个网页的截图driver.save_screenshot("screenshot.png")# 根据验证码图片元素的位置和大小，从整个网页截图中裁剪出验证码图片left = int(location["x"])top = int(location["y"])right = int(location["x"] + size["width"])bottom = int(location["y"] + size["height"])captcha_screenshot = Image.open("screenshot.png").crop((left, top, right, bottom))print(left)print(top)print(location)print(bottom)# 保存裁剪后的验证码图片，并进行识别captcha_screenshot.save("captcha.png")with open("captcha.png", "rb") as f:    img_bytes = f.read()res = ocr.classification(img_bytes)print("识别的验证码是：" + res)

基本思路是没啥问题的，确实也是可以拿到对应界面的截图，只不过是验证码的位置截取出现了点偏差，导致验证码没正确识别到。

下面这个代码是获取验证码图片元素的位置和大小：

location = captcha_element.locationsize = captcha_element.size

这个部分我看介绍应该是会返回定位的元素位置，我刚刚大致拖拉了一下在裁剪前的定位打印出来确实就已经去了输入密码附近的位置了但是我定位的元素是验证码的地方，并且我也尝试了先定位验证那个位置的大元素再定位至具体的验证码图片位置问题依旧。

上面是粉丝的疑惑，下面一起来看看解决办法。

二、实现过程

这里【魏哥】尝试了下代码，但是出现下图报错：

这个报错还是蛮常见的，对于时常使用sel的人来说，这个报错算是家常便饭了，报错的原因是本地浏览器驱动和谷歌浏览器的版本不匹配，需要更换本地浏览器驱动。

关于这个问题的解决方法，就是去网页下载对应浏览器版本的对应驱动，放到本地指定文件夹，确保该文件夹路径有加入环境变量。该问题的解决办法公众号历史文章也有提及，网上的解决教程也一大堆，这里不再赘述。

言归正传，继续回到这个问题的解决办法。这里【甯同学】给了一个思路，直接找到验证码的图片的url 用requests 请求验证码的.content 用 ocr.classification(验证码的.content) 就可以了不用保存图片在open读取二进制流，代码如下所示：

顺利地解决了粉丝的问题，如果对requests和Beautiful还不熟悉的小伙伴，可能接受起来就比较困难一些。

这里只是给出了其中一个方法，另外的一个方法，一起看下一篇文章，敬请期待！

三、总结

大家好，我是皮皮。这篇文章主要盘点了一个Python网络爬虫过验证码的问题，文中针对该问题，给出了具体的解析和代码实现，帮助粉丝顺利解决了问题。

最后感谢粉丝【鶏啊鶏】提问，感谢【甯同学】、【魏哥】给出的思路和代码解析，感谢【Ineverleft】等人参与学习交流。

【提问补充】温馨提示，大家在群里提问的时候。可以注意下面几点：如果涉及到大文件数据，可以数据脱敏后，发点demo数据来（小文件的意思），然后贴点代码（可以复制的那种），记得发报错截图（截全）。代码不多的话，直接发代码文字即可，代码超过50行这样的话，发个.py文件就行。

大家在学习过程中如果有遇到问题，欢迎随时联系我解决（我的微信：pdcfighting1），应粉丝要求，我创建了一些高质量的Python付费学习交流群和付费接单群，欢迎大家加入我的Python学习交流群和接单群！

小伙伴们，快快用实践一下吧！如果在学习过程中，有遇到任何问题，欢迎加我好友，我拉你进Python学习交流群共同探讨学习。

------------------- End -------------------

往期精彩文章推荐：

if a and b and c and d：这种代码有优雅的写法吗？

Pycharm和Python到底啥关系？

都说chatGPT编程怎么怎么厉害，今天试了一下，有个静态网页，chatGPT居然没搞定？

站不住就准备加仓，这个pandas语句该咋写？

欢迎大家点赞，留言，转发，转载，感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群】

万水千山总是情，点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

比迅雷好用N倍！这个新晋的开源下载工具，才是真的万能

生物医学工程考研方向女生_生物医学工程考研方向|天天速递

日本十大顶尖声优 又一童年巨作一休哥声优去世|热门看点

洛克王国星辰宝宝技能搭配（洛克王国星辰宝宝）-全球实时

【世界独家】华工科技跌停 机构净卖出1.12亿元

户外用品市场竞争格局及户外用品行业发展分析2023

qq飞车新车怎么改_qq飞车新车

世界视点！2023端午礼盒大赏，浓郁中国风

头条焦点：“保壳”！这家房企踏进新能源

tax registration number 纳税人识别号（registration number是什么意思）

环球热门:龙舟竞渡燃端午 多地举行丰富多彩的活动

快资讯：劳动仲裁不受理可以直接起诉吗

建议中老年人：夏季养生做好6件事，身体健康少生病，平安度夏天

啥叫网络连接受限_网络连接受限制或无连接 热闻

癌症结局有何性别差异？最新研究称雄性常比雌性受到更大不利影响

女模脱高跟鞋怒砸评委？！官方回应 世界快播

今日端午，上海这些彩旗飘扬的“非遗”龙船你了解吗？_全球看点

世界实时：农林设施用地规划新政

热评｜“鼠头现形记”教训深刻 精选

端午去哪玩？阿拉善各大景区放大招啦！-世界微头条

宁德时代：拟使用不超过78亿元闲置募集资金进行现金管理

世界快看：又是电热水器惹祸！深圳一女子洗澡时因触电身亡

热点评！临时停火协议到期 苏丹多地再度爆发冲突

揭牌！荔湾区数字政府运营中心启动运营

热门看点：晋江市领导开展“七一”走访慰问活动

迪士尼新片《幽灵鬼屋》曝剧照 众人集结寻找真相-环球消息

全球微资讯！局长被曝与女子有不当关系 官方回应 聊天内容令人咋舌！

资讯：天津港股票行情今日（天津港股票）

kkOma：了解中国选手的攻击性打法 确信韩国队能在杭州夺得金牌-时讯

环球热点评！IPO动态：腾龙健康拟在深交所主板上市募资10.13亿元

中国气象局部署推进应对气候变化工作

城地香江 截止到2023年一季度末的股东总数为28,860人

华学健到邵阳县调研犬木塘水库灌区项目建设工作|世界热门

中京电子：子公司中京新能源拟增资扩股引入战投格金八号 焦点热讯

深港国际肿瘤学术会议暨深港肿瘤医疗协作创新与发展研讨会在香港召开 全球热闻

【天天速看料】目睹“生割腰子”、手指险被砍断……缅北逃回男子自述

十一位技术高管“出走”背后，中国自动驾驶行业正在“觉醒”

天天新消息丨用Python写了一个「拥抱梅西」的小游戏

实时：天富龙IPO：原材料涨价致毛利率逐年下滑 主要产品销量下滑拦不住扩产脚步

激活数据要素潜能 数据要素统一大市场对接活动在郑州举行 世界速看

中企反击美日芯片联盟，对30家日企征收专利费，背后有更长远布局_世界微速讯

焦点快报!莲字第四笔是什么_莲字

今日关注：首届京津冀生态产业创新发展大会聚焦低碳环保

环球速递！云南能投加大新能源业务布局 风电光伏“搭配”储能或成发电大户

环球信息:最新民调：44%澳大利亚受访者将中国视为经济伙伴

今年夏天火了一种“气泡水”穿搭，清凉舒适又高级，明星也在跟风

焦点快报!2023年基金从业资格考试《私募股权投资》每日一练0621_基金从业资格考试

全球微速讯：月销量高达29081台，起售价11.68万，比亚迪海豚究竟强在哪里？

环球视讯！国家发展改革委发布50个职业教育产教融合典型案例

环球观天下！开通在即！连接咸阳主城区的16号线最新照片来了~

AI秒变印钞机！扎克伯格、黄仁勋等暴赚上万亿

每日聚焦：浅灰色地砖配什么颜色的门(浅灰地板搭配什么颜色的门?)

张颂文新片点映，观众直呼太敢拍，它的尺度真不小|全球观热点

甘肃文旅集团成立四周年暨专题推介活动在兰举行

天天观天下！右脚麻木是怎么回事呢_右脚麻木是怎么回事

专家献策厦门国家物流枢纽承载城市建设 第十四届厦门市宏观经济高端论坛举行 天天即时

宁夏银川一烧烤店液化气泄漏引发爆炸 已致31死7伤

白面煎饼面糊怎么调？ 煎饼的面糊怎么做？|天天即时

高温下各行各业坚守依旧 各地多措并举做好防暑降温

销售代表开发医院“五道坎”，如何顺利迈过？

湄南高科完成数千万元天使轮融资

玉鸟奇幻游良渚 萌童光影夜市热闹非凡-环球观焦点

福岛民众：排污入海让多年努力成泡影

致欧科技上市首日涨6.8% 募9.9亿2021扣非净利降55% 环球速看

彤程新材（603650）6月21日主力资金净卖出1310.23万元

【世界独家】重磅！苹果Vision Pro开发者工具包正式发布！上海开设首批实验室

2023马兰头价格多少钱一斤？

赛龙舟、包粽子......各地如何过端午？热闹场面来啦 天天亮点

高温热浪来袭！国家疾控局发布健康防护指南_环球快报

中国互联网协会：打击利用恶意投诉非法牟利行为_天天关注

抢抓就业关键期 精准提供就业服务 天天时讯

南昌县：暴雨来袭 农技专家地头“把脉支招”

环球消息！微软宣布Xbox Series X和主机版XGP将涨价

如何加快创新型云南建设？从十个方面发力 热资讯

即时焦点：公益微视频｜珍惜粮食，你我有责

济宁高新区王因街道三河新村开展“征信知识进村居”宣讲活动 环球微动态

白色阿诗玛多少钱一包_蓝色阿诗玛多少钱一包-全球新视野

长期吃阿胶会变漂亮吗

成语白里透红透是什么意思 白里透红的透字的意思是什么

环球微动态丨鲜于子骏用鲁直见寄韵因以为谢_关于鲜于子骏用鲁直见寄韵因以为谢简述

日本十大顶尖声优又一童年巨作一休哥声优去世|热门看点

【世界独家】华工科技跌停机构净卖出1.12亿元

环球热门:龙舟竞渡燃端午多地举行丰富多彩的活动

啥叫网络连接受限_网络连接受限制或无连接热闻

女模脱高跟鞋怒砸评委？！官方回应世界快播

热评｜“鼠头现形记”教训深刻精选

热点评！临时停火协议到期苏丹多地再度爆发冲突

迪士尼新片《幽灵鬼屋》曝剧照众人集结寻找真相-环球消息

全球微资讯！局长被曝与女子有不当关系官方回应聊天内容令人咋舌！

kkOma：了解中国选手的攻击性打法确信韩国队能在杭州夺得金牌-时讯

城地香江截止到2023年一季度末的股东总数为28,860人

中京电子：子公司中京新能源拟增资扩股引入战投格金八号焦点热讯

深港国际肿瘤学术会议暨深港肿瘤医疗协作创新与发展研讨会在香港召开全球热闻

实时：天富龙IPO：原材料涨价致毛利率逐年下滑主要产品销量下滑拦不住扩产脚步

激活数据要素潜能数据要素统一大市场对接活动在郑州举行世界速看

环球速递！云南能投加大新能源业务布局风电光伏“搭配”储能或成发电大户

专家献策厦门国家物流枢纽承载城市建设第十四届厦门市宏观经济高端论坛举行天天即时

宁夏银川一烧烤店液化气泄漏引发爆炸已致31死7伤

白面煎饼面糊怎么调？煎饼的面糊怎么做？|天天即时

高温下各行各业坚守依旧各地多措并举做好防暑降温

玉鸟奇幻游良渚萌童光影夜市热闹非凡-环球观焦点

赛龙舟、包粽子......各地如何过端午？热闹场面来啦天天亮点

抢抓就业关键期精准提供就业服务天天时讯

南昌县：暴雨来袭农技专家地头“把脉支招”

如何加快创新型云南建设？从十个方面发力热资讯

济宁高新区王因街道三河新村开展“征信知识进村居”宣讲活动环球微动态

成语白里透红透是什么意思白里透红的透字的意思是什么

常州GDP超过西安，但城市发展还有差距焦点短讯

七仙女都分别嫁给了谁白莲公主的后代是二郎神吗|全球快讯

剑与远征斗技大会怎么兑换（剑与远征斗技大会排名有奖励吗）全球消息

入摩、入富、入标以来全球资金对A股关注度持续提升环球观天下

2023全球数字经济大会7月举行将呈现“五大亮点”_焦点信息

每日消息!沪指失守3200点市场底在何方？分析称节后大概率将企稳

当前快看：扬州好的养老院扬州三星级养老院名单

初入职场必须了解的十个法律问题焦点速看

热门车讯东风风神明年将推H30 CROSS和新中级轿车全球信息

日本十大顶尖声优又一童年巨作一休哥声优去世|热门看点

【环球播资讯】急需用钱怎么办10分钟征信不好哪些可以借钱

招商银行卡暂停非柜面交易怎么办怎么恢复正常

硅兔首发｜前苹果、特斯拉高管推出下一代智能电动房车Pebble，获千万美元融资全球新要闻

【世界独家】华工科技跌停机构净卖出1.12亿元

iOS 17.0 beta 2 即将上线，准备好了吗？速看

新婚女子端午回娘家，晒5家亲戚的招待饭菜，网友：第5家以后不要去了全球热消息

广联航空联合中标中机身壁板组件装配生产线国际招标项目全球讯息

【短讯】长三角科创金融改革试验区有哪些机构新动作？设立科技金融专营机构联动PE/VC共建“股+贷”生态圈

巨亏1200亿美元美股空头大军损失惨重-全球微资讯

凯鸿物流子公司嘉兴凯来拟投资建设凯来化工产品仓储建设项目预计项目总投资额1.03亿