当前位置：
首页
/
生活
/
更多
/
其他

如何用python抓取动态网页数据

发布于 2021-10-24 11:05:12 浏览 446

如何用python抓取动态网页数据

详情：

1、 1.在百度首页输入“名词”，百度会出现这样的网页 2、 2.在浏览器中按F12，打开开发者工具，选中network、ALL，点击名词的“下一页”，会显示出请求数据。 3、 3.点击右侧的Preview，会看到有json数据，展开后，能看到显示的名词。 4、 4.在headers中能看到请求的url地址跟参数，接下来就是要在pycharm中编写代码来获取相应的数据了。 5、 5.# -*- cong:utf-8 -*- 6、 import re,requests,json 7、 from lxml import etree 8、 headers = { 9、 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/ 10、 74.', 11、 def downloadtxt(url,coding="gb2312"): 12、 try: 13、 html = requests.get(url, headers=headers) 14、 html.encoding = coding 15、 return html.text 16、 except: 17、 return 18、 if __name__ == '__main__': 19、 for i in range(432): 20、 url = "https://sp 21、 0.baidu.com/8aQDcjqpAAV3otqbppnN2DJv/api.php?resource_id=28204&from_mid=1&format=json&query=名词&sort_type=1&pn={}&rn=40".format(i*40) 22、 res = downloadtxt(url) 23、 json_data = json.loads(res) 24、 for word in json_data['data'][0]['result']: 25、 print(word['ename'],end=',') 26、 print() 27、 downloadtxt是封装的一个获取请求返回结果的函数，在main主函数中有进行调用，for i in range(432)，是因为共有432页。 28、 6.最后会直接print到屏幕，结果如图。

上一篇：Word怎么将图片上文字转换成文本文字下一篇：分区助手分区步骤

相关推荐

水果店收银系统怎么弄水果店收银系统的方法：把条形码都放在一起扫描即可，但要知道对应的是哪种，可以用打条形码的机器。
其他发布于 2022-06-03 03:10:49 浏览 642
分布式计算是什么分布式计算（Distributed computing），又译为分散式运算，是一门计算机科学，它研究如何把一个需要非常巨大的计算能力才能解决的问题分成……
其他发布于 2021-12-29 13:47:26 浏览 674
射手座和什么座最配当自由热情的射手座碰见活力十足的狮子座，就如同是火星撞地球，很快会擦出爱情的火花。
其他发布于 2021-10-31 12:51:41 浏览 718
古筝多少钱一架 1、古筝价格可划分为几个区间，练习指法筝：2000元左右，中档筝：3000-5000元，高端演奏筝：7000-9000元，精品收藏筝：1万以上。选择什么价位的古……
其他发布于 2021-10-13 12:02:52 浏览 701
虎年出生的人的命运如何 1962年属虎，有骨气，不屈服于强权，充满正义感。1974年属虎，不论对方如何攻击，皆会抵抗到底，人生路途曲折崎岖。1986年属虎，有敏锐的灵感，如……
其他发布于 2021-09-20 20:12:33 浏览 584
厨师证怎么考 1.首先是理论部分的相关的考试。首先，必须了解厨师资格考试的大纲，必须深入的了解其大纲，这是第一步的基础。 2.了解其大纲后，开始有……
其他发布于 2021-08-29 05:14:05 浏览 582
应付账款周转天数如何计算应付账款周转天数计算公式：应付账款周转天数=360/应付账款周转率=平均应付账款×360天/销售成本应付账款周转率是指反映企业应付账……
其他发布于 2020-10-20 12:15:35 浏览 609
劲舞的商场怎么买衣服啊一充值，可以去网吧和网管说，我要冲劲舞团游戏币，有不同价位自己选择，或者你去报亭之类的地方买充值卡，一般10元面值的9.5就可以买到。……
其他发布于 2020-04-16 01:58:14 浏览 328
什么是通用串行总线控制器 USB，即Universal Serial Bus的缩写，译成中文，就是通用串行总线，这是由Intel公司开发的通用串行总线架构；因此顾名思义，通用串行总线控制……
其他发布于 2020-03-08 08:38:47 浏览 651
造梦西游3的小龙女在哪打好，小龙女的副本攻略如下：进入神兽森林　　到第三个场景，在背包有避水珠的情况下，按住下+跳跃进入水下迷宫　　在你初入的房间里，打完……
其他发布于 2020-03-07 01:25:06 浏览 656

本周热门排行

热门职业

您可能感兴趣的

海蝶旗下的艺人: 海贼王是什么时候出的; 苹果手机怎么没有个人热点; 飘飘欲仙类似的小说; 螃蟹和柿子一起吃了怎么办; 排球上手发球的技术动作要领

Copyright 抉信网 All Rights Reserved 桂ICP备2022002235号桂公网安备45098102000464号