当前位置: > 狗狗资讯 > 狗狗医疗 > python 爬虫:你觉得可以用python爬虫做哪些有意思的事情?

python 爬虫:你觉得可以用python爬虫做哪些有意思的事情?

编辑:sqxzgg 时间:2022-04-06 来源:人人爱宠物网

当然是批量下载B站视频啦,主要分为2步,首先爬取视频url地址,然后根据url地址下载视频,下面我简单介绍一下实现过程,实验环境win10 python3.6 pycharm5.0,主要内容如下python 爬虫:

python 爬虫:你觉得可以用python爬虫做哪些有意思的事情?

这里为了更好的说明实验过程python 爬虫,以爬取B站的TED演讲为例,如下:

python 爬虫:你觉得可以用python爬虫做哪些有意思的事情?

python 爬虫:你觉得可以用python爬虫做哪些有意思的事情?

1.首先,爬取视频的url地址信息,B站视频的信息是动态加载的,存储在一个json文件中,所以需要进行抓包分析,按F12调出开发者,F5刷新页面,查看所有抓包信息,如下,可以看到json格式加载的视频信息python 爬虫:

python 爬虫:你觉得可以用python爬虫做哪些有意思的事情?

python 爬虫:你觉得可以用python爬虫做哪些有意思的事情?

2.接着就是获取上面的json文件,解析这个json文件,提取到我们所需要的视频信息,这里主要是获取到url地址信息,代码如下,主要用到requests和json这2个模块,其中requests用于获取json文件,json用于解析json文件python 爬虫:

python 爬虫:你觉得可以用python爬虫做哪些有意思的事情?

python 爬虫:你觉得可以用python爬虫做哪些有意思的事情?

运行程序python 爬虫,效果如下,已经成功获取到视频信息:

3.最后就是根据视频url地址批量下载视频了,这里主要用到you-get这个模块,安装的话,直接在cmd窗口输入命令“pip install you-get”就行,基本使用方式“you-get 视频URL地址 -o 视频存放目录”,这里我们直接使用os.system执行这个命令就行,主要代码如下,非常简单:

运行程序,截图如下,已经开始下载视频:

接着打开对应的视频存放目录,就可以看到正在下载的文件,如下:

至此,我们就完成了利用python爬取并批量下载B站视频。总的来说,整个过程非常简单,就是步骤有些繁琐,只要你有一定的python爬虫基础,熟悉一下上面代码,多调试几遍程序,很快就能掌握的,网上也有相关教程和资料,非常丰富详细,感兴趣的话,可以搜一下,希望以上分享的内容能对你有所帮助吧,也欢迎大家评论、留言。

Python3爬虫入门,有什么好的建议吗?

爬虫入门的话,很简单。爬虫说白了,就是一个获取网页,解析网页,得到数据的过程,只要你有一定的python基础,能看懂简单的网页,会使用浏览器自带的抓包工具,还是很快就能入门的,下面关于python爬虫,我总结一下几点:

python 爬虫:你觉得可以用python爬虫做哪些有意思的事情?

1.会基本的网页知识,会基本的前端知识,像html,css,javascript等。目前,我们爬取的数据都是网页上的,大部分数据都嵌套在网页源码中,最起码我们要能看懂这些html代码,像基本的div,span,class等,这些是解析数据的前提,我们是搞前端的,没必要精通它们,但是要最起码的了解,看得明白,如果你从没有接触过网页这方面的知识,建议你花个几天时间了解一下:

python 爬虫:你觉得可以用python爬虫做哪些有意思的事情?

python 爬虫:你觉得可以用python爬虫做哪些有意思的事情?

2.会简单的使用浏览器自带的开发者工具。一般情况下,我们爬取的数据都是静态的,直接嵌套在网页源码中,但是有些数据就不是,它是动态加载的,不在网页源码中,只有在请求页面的时候才开始加载数据,这个时候就需要会抓包分析,获取真实存储数据的文件,对这个文件进行解析,才能获取到我们需要的数据,大部分情况下都是一个json文件,这时候你就需要对json文件进行解析:

3.最后就是真正的入门python爬虫,开始的话,可以爬一些简单的网页,数据量也不大,使用requests,BeautifulSoup,urllib等先进行练习,掌握基本的爬虫,后面熟悉后,就可以学习一下爬虫框架,像scrapy等,毕竟框架使用来开发效率更高,更快,而且大部分项目都使用的框架进行开发:

掌握这些后,大部分网页数据的爬取都可以进行,再到后面的分布式、多线程,数据的存储等都需要学习,我这里就不多写了,网上大牛写的很多,有许多这方面的经验,你可以搜搜,学习一下,我想说的就这么多,主要还是多练习,多做项目,多积累经验,这样才能有一个快的进步,希望以上分享的内容能对你有所帮助吧。

阅读:

狗狗医疗