您的位置:首页 >聚焦 >

福利啊!120行代码,用Python批量抓取B站小姐姐的舞蹈视频,满屏美腿!

2022-03-04 14:09:02    来源:程序员客栈
大家好,我是菜鸟哥!周末宅在家没有事情,只能看看动漫,逛逛B站。最近,菜鸟哥都在B站上欣赏小小姐姐的舞蹈视频,像是“欣小萌”、“慕慕有奶糖”等UP主都是菜鸟哥的关注对象。菜鸟哥只是单纯的从舞蹈欣赏的角度,来观看小姐姐们的舞蹈视频。

刚好,菜鸟哥也已经好久没有为大家奉上福利了,今天,就带领大家,来批量抓取小姐姐们的舞蹈视频,让大家一次看个够。

01.抓取视频子页面地址

接下来的内容,我们将以“欣小萌”的视频抓取为例进行。

首先,我们打开舞蹈视频的主页,可以看到所有的舞蹈视频内容。

看到这样的界面,熟悉菜鸟哥之前文章的小伙伴们也大概知道抓取的流程。通过F12,打开开发者模式,然后再“network”下,找到以“search?mid=”开头的链接。点进去后,就可以看到舞蹈视频的关键信息内容。

我们需要抓取的就是bvid数据,通过这个数据,便可以构建每个舞蹈视频的链接,例如:https://www.bilibili.com/video/BV1uR4y1G7bd。

当然,我们的程序可以借鉴之前菜鸟哥同大家分享的(这里贴上扬名立万的链接)程序,来抓取每个舞蹈视频的bvid数据。

上述程序的内容分析,也可以借鉴之前分享的文章。获取到bvid数据后,接下来我们就来分析如何下载视频到本地。

上述的程序中,是视频提取程序的入口函数。

第7行程序,首先提取出链接地址当中的BV数据,也即bvid数值。

第8行程序,利用get_cid函数,获取cid的数据;

第9行程序,利用get_list函数,来获取视频的链接地址。

第11-15行程序,通过requests库抓取视频写入到本地。

上述程序中,给出了get_cid和get_list函数,函数都是利用requests库来向链接请求json数据,然后提取json数据当中的关键信息。

值得注意的是,上述的第11行程序中,构造的请求链接,有“qn”参数。其中,80表示的是1080高清。数值与清晰度的对应关系,如下表所示。

02.结果展示

程序讲解完毕后,接下来我们就看一下抓取的结果吧。

上图展示的是抓取视频的封面,可以看到,几乎每张封面都是小姐姐的舞蹈动作。下面菜鸟哥为大家展示一个小姐姐的舞蹈视频。

视频展示

总结:

以上就是菜鸟哥今天为大家带来的福利内容,希望大家在学习程序的同时,能够下载自己喜欢的B站小姐姐舞蹈视频。

其实Python功能还是很强大,爬虫,数据分析,机器学习,自动化测试,运维,web网站后端开发样样都可以做,真的是非常一门值得学习的语言。有兴趣的同学可以操练起来,欢迎大家在下方留言吱一声,记得给个三连哦!

我是菜鸟哥,我们下期文章不见不散。

有兴趣的同学可以火速加入我们的星球3周零基础入门提供10节课程全年12节趣味实战项目含源码,每月奖励优秀的Top3同学送书专业的答疑群,大厂的老师保姆式的教学如果不满意,三天内随意退款!一年88,现在优惠16元

扫码加入,3周零基础入门

关键词: 的舞蹈视频 内容分析 自己喜欢的

相关阅读