苹果一次性代码怎么看(转移到ios六位代码在哪里)

背景描述

最近需要收集百度搜索查询结果,可是使用的时候,发现之前的python脚本程序失效了。

这使我无法批量采集所需的关键词数据。

问题描述

启动python脚本程序后,获取的数据一直是空值。

request请求结果返回的html页面是百度安全验证页面。

问题演示

搜索了一下,知道这是百度设置的反爬机制。

如果请求被检测判定为非人类,则会返回此页面。

苹果一次性代码怎么看(转移到ios六位代码在哪里)

<!DOCTYPE html><html lang="zh-CN">  <head>    <meta charset="utf-8">    <title>百度安全验证</title>    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">    <meta name="apple-mobile-web-app-capable" content="yes">    <meta name="apple-mobile-web-app-status-bar-style" content="black">    <meta name="viewport" content="width=device-width, user-scalable=no, initial-scale=1.0, minimum-scale=1.0, maximum-scale=1.0">    <meta name="format-detection" content="telephone=no, email=no">    <link rel="shortcut icon" href="https://www.baidu.com/favicon.ico" type="image/x-icon">    <link rel="icon" sizes="any" mask href="https://www.baidu.com/img/baidu.svg">    <meta http-equiv="X-UA-Compatible" content="IE=Edge">    <meta http-equiv="Content-Security-Policy" content="upgrade-insecure-requests">    <link rel="stylesheet" href="https://ppui-static-wap.cdn.bcebos.com/static/touch/css/api/mkdjump_aac6df1.css" />  </head>  <body>    <div class="timeout hide-callback">      <div class="timeout-img"></div>      <div class="timeout-title">网络不给力,请稍后重试</div>      <button type="button" class="timeout-button">返回首页</button>    </div>    <div class="timeout-feedback hide-callback">      <div class="timeout-feedback-icon"></div>      <p class="timeout-feedback-title">问题反馈</p>    </div>    <script src="https://ppui-static-wap.cdn.bcebos.com/static/touch/js/mkdjump_v2_2d634b8.js"></script>  </body></html>

我的思考

为了能够解决这个问题。

首先我猜想可能是请求头headers的数据过期了。

我通过浏览器F12,拿到最新的cookie,在代码中替换了cookie

初次尝试

尝试执行代码,结果失败。依旧是百度安全验证页面。

再次思考

我二次猜想,把浏览器中成功获取搜索结果的url,替换成我在代码中发起的请求url

当然,此时的cookie也是当前页面请求中发起的cookie

再次尝试

这次,代码是可以正常请求到数据的。

一个猜想

我替换了url中的关键词word,然后执行代码,又会返回安全验证。

我心想难道百度现在这么坑,一次搜索结果就要对应一个cookie么。

得出结果

头好痛,我可能要长脑子了。

终于脑子长出来了,我找到了突破口。

我发现用urllib库的request模块就可以正常请求得到网页数据。

既然这个模块可以拿到数据,就现从这一块入手。

编写代码进行测试。

req = urllib.request.Request(url, headers=headers)
response = urllib.request.urlopen(req)

html = response.read().decode('utf-8')
print(html)
html = etree.HTML(html)
苹果一次性代码怎么看(转移到ios六位代码在哪里)

image.png

可以拿到数据得到数据。

那就可以完善代码,实现自动翻页爬取分页数据了。

既然urllib库可以请求成功,那我之前的两个猜想就都是胡言乱语。

虽然我没有搞清楚为什么request库会被反爬机制制裁。

但是既然可以完成需求,那就先用着。

能跑就行(不是)。

附加彩蛋

在一度思索反爬原理而得不到结果的时候,我想到了借助网页采集工具来实现我的需求。

我便选择了八爪鱼采集器。

这个工具很强大,不需要懂代码,就可以完成网页数据的采集。

花了十分钟做了简单的配置我就在八爪鱼获得了想要的数据。

苹果一次性代码怎么看(转移到ios六位代码在哪里)

屏幕截图 2023-03-03 142024.png

结语

此次实践目标是:收集百度搜索的词条数据。

使用了两种收集方式:

  1. python脚本
  2. 八爪鱼采集器

对比优缺点

  • 各自优点

python性能更好,可以对数据进行更为复杂的处理。

八爪鱼采集器上手简单,无需代码即可采集数据。

  • 各自缺点

python需要一定的编程基础,对小白不太友好。

八爪鱼采集器可以采集数据,但是只能做一些简单的逻辑处理判断。

疑点未解决

python脚本中request库模拟请求会被百度反爬机制干掉,但是urllib库的request模块模拟的请求可以正常使用,这背后的原因是什么。

本文部分内容来自互联网,如有疑问请与我们联系。

发布者:币侠财经,转转请注明出处:https://www.yfhhf.com/baike/169725.html

(0)
                       
上一篇 2023年 3月 31日 下午4:35
下一篇 2023年 3月 31日 下午4:49

相关推荐

  • 洗耳球的正确使用方法(洗耳球的正确使用方法左手)

    作者:菠萝麻麻 本文由萌爪医生团队原创,谢绝转载 如有需要,请联系hi@wecarepet.com 过年了,在这个特殊的春节,虽然不能访亲走友,但家里还是需要大扫除,并且毛孩子的清洁问题也要注重。 自己收拾的香香白白的,也不能忽略它们,爱干净就要一起。 但要想当一个干净的毛孩子,仅仅洗澡是不够的。除了定期的刷牙,剪指甲之外,对于狗狗来说,耳道清洁也是必不可少…

    2023年 4月 11日
    2670
  • 去哪里旅游好玩又便宜(去哪里旅游好玩又便宜的地方)

    8月,夏天还没过去,秋天即将到来,更是一个适合出游的季节,但天气仍然酷暑难耐,国内都有哪些适合这个时候旅行的地方呢?俗话说,哪凉快上哪呆着去!小编推荐11个精华旅行地,不但风景优美,适合旅行度假,更重要的是还有一份清凉,这些地方你都去过吗? 一、新疆伊犁 有人说,“不到新疆不知中国之大,不到伊犁不知新疆之美”,这里有最美丽的山谷,有被称为大西洋最后一滴眼泪的…

    2023年 2月 4日
    2760
  • 龙岗小学排名(龙岗区小学排名前十)

    近日,深圳市教育局组织召开了全市民办中小学工作推进会,会上对全市优质特色民办学校进行了表彰,龙岗区共11所民办学校代表(深圳市建文外国语学校、龙岭学校、东方半岛小学、龙岭初级中学、深圳实验承翰学校、丰丽学校、兴泰实验学校、鹏达学校、科城实验学校、智民实验学校、兴文学校 )上台领奖接受表彰,获奖数量全市第一。 近年来,龙岗区委、区政府出台了一系列扶持民办学校优…

    2022年 11月 9日
    1.4K0
  • 杨振宁96岁喜得贵子图片(杨振宁96岁喜得贵子图片 新闻)

    前段时间有很多朋友都想知道杨振宁96岁喜得贵子图片是什么。今天小编特意为大家整理了相关知识来解答!还有其他网友想搞清楚杨振宁96岁喜得贵子图片 新闻,币侠网小编(www.yfhhf.com)现在为大家找到了相关问题的答案,接下来一起看看吧,希望能给大家带来帮助。 1950年,杨振宁在美国留学期间与挚爱杜致礼结婚。 在之后的学术生涯中,杨振宁除却科研上的成就外…

    2022年 10月 9日
    2590
  • 少林寺十大绝学(少林寺十大绝学名字)

    根据野史记载,南朝梁武帝年间,菩提达摩在河南少室片面壁九年,武功日益精进,并领悟出七十二路绝学,绵延千载。于是也有了“天下武功出少林”的说法。而中国功夫电影,又怎能少得了这些绝技的展示呢?电影人在保留了博大精深的少林武学文化同时,并用极富想象力的方式再次改良和加工,将它们变成了电影中一个个令人叹为观止的视觉奇观,本文便带领大家一窥功夫电影中所出现过的标志性的…

    2022年 11月 13日
    6020

联系我们

不接风险内容

在线咨询: QQ交谈

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信