python最新采集某站美女,还不快学起来,下载可能下架视频
创始人
2024-05-23 22:32:46
0

前言

大家早好、午好、晚好吖 ❤ ~

这个页面大家认识吧~

喜欢看吧

那我们今天就来采集一下它呀~

开发环境:

  • 版 本: python 3.8

  • 编辑器: pycharm 2022.3.2 专业版

  • requests >>> pip install requests

  • ffmpeg 音视频合成软件

如果安装python第三方模块:

  1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests)回车

  2. 在pycharm中点击Terminal(终端) 输入安装命令

( 源码、教程、文档、软件点击此处跳转跳转文末名片加入君羊,找管理员小姐姐领取呀~ )

实现一个案例的流程:

一. 思路分析

案例的分析 视频 media .mp4 .mp3 .m4a m3u8视频流

.m4s: 视频/音频 格式

数据来源分析: 找到视频内容

network抓包

查看网页源代码

  1. 如果在XHR当中没有找到数据

    搜索了, 筛选了 就是找不到

  2. *仔细观察网页源代码

二. 代码实现(代码实现基本流程)

  1. 发送请求 使用代码的方式访问网站

  2. 获取数据 取出网页源代码

  3. 解析数据 提取视频链接

  4. 保存数据

代码展示

导入模块

import requests
import re       # 正则表达式模块
import json
import pprint
import subprocess
import os

伪装(请求头)

headers = {# 用户信息"cookie": "buvid3=355AA300-6A61-04E5-A05C-E891D886F69632716infoc; b_nut=1675085932; i-wanna-go-back=-1; _uuid=387EA3810-FBF5-E92C-827E-2510B578C5B9A33232infoc; buvid4=15C69C98-F6A7-EC6A-872F-E69C1840DD6D33724-023013021-1pW1w45e5fZS9RtebDiGZw%3D%3D; nostalgia_conf=-1; CURRENT_FNVAL=4048; rpdid=|(kmJY|k))lY0J'uY~l|)lmY|; SESSDATA=17eb9f1a%2C1690782878%2C6a25c%2A22; bili_jct=4af9076b42f76603dfe4cf018ad2000f; DedeUserID=422789639; DedeUserID__ckMd5=fc4901c78719b545; CURRENT_QUALITY=80; b_ut=5; b_lsid=51ED8F105_1861C3EEC10; theme_style=light; is-2022-channel=1; sid=66dafqju; fingerprint=97ca5a8b555e63aca787c9cd27273c7e; buvid_fp_plain=undefined; buvid_fp=8cc52ae38b592ff26dc2b393eebd890b; PVID=2; innersign=1; bp_video_offset_422789639=758803412994228200",# 防盗链"referer": "https://www.****.com/",# 浏览器基本信息"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36"
}

发送请求

url = 'https://www.***.com/video/BV1qv4y1k7UE/?vd_source=8f216a44bce0dbe14e3447c34c2ab3e2'
response = requests.get(url, headers=headers)

获取数据

html_data = response.text

解析数据

playinfo=(.*?)

json_str = re.findall('__playinfo__=(.*?)', html_data)[0]
# 

(.*?)

title = re.findall('

(.*?)

', html_data)[0] # Python基础 字典 json_data = json.loads(json_str) # pprint.pprint(json_data) audio_url = json_data['data']['dash']['audio'][0]['baseUrl'] print(audio_url) video_url = json_data['data']['dash']['video'][0]['baseUrl'] print(video_url)

保存数据

audio_data = requests.get(audio_url, headers=headers).content
with open(f'{title}.mp3', mode='wb') as f:f.write(audio_data)
video_data = requests.get(video_url, headers=headers).content
with open(f'{title}.mp4', mode='wb') as f:f.write(video_data)ffmpeg = f'ffmpeg -i {title}.mp4 -i {title}.mp3 -acodec copy -vcodec copy {title+"-out.mp4"}'
subprocess.run(ffmpeg)
os.remove(f'{title}.mp4')

![

尾语 💝

好了,今天的分享就差不多到这里了!

完整代码、更多资源、疑惑解答直接点击下方名片自取即可。

有更多建议或问题可以评论区或私信我哦!一起加油努力叭(ง •_•)ง

喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇👇

相关内容

热门资讯

未来学校作文400字 未来学校作文400字(通用51篇)  在日常学习、工作和生活中,大家最不陌生的就是作文了吧,写作文是...
编童话故事作文 关于编童话故事作文十篇  在现实生活或工作学习中,大家都尝试过写作文吧,写作文可以锻炼我们的独处习惯...
未来的校园作文600字 未来的校园作文范文600字(精选25篇)  在平时的学习、工作或生活中,大家对作文都再熟悉不过了吧,...
我是霸王龙童话故事 我是霸王龙童话故事  很久很久以前,在一个悬崖顶上住着翼龙和翼龙妈妈。  有一天,翼龙妈妈下了一个蛋...
为自己而活作文 为自己而活作文(通用28篇)  在学习、工作乃至生活中,大家都有写作文的经历,对作文很是熟悉吧,作文...
讲人物故事作文 讲人物故事作文四篇  在日常的学习、工作、生活中,大家都不可避免地会接触到作文吧,借助作文可以宣泄心...
胜似亲人的作文 精选胜似亲人的作文7篇  在日常的学习、工作、生活中,大家总少不了接触作文吧,作文是人们以书面形式表...
家乡的景物作文 精选家乡的景物作文5篇  在日常生活或是工作学习中,大家总少不了接触作文吧,作文可分为小学作文、中学...
相约兰草谷散文 相约兰草谷散文  带着满身清凉,聆听山谷花开的声音;招揽漫山爱意,感受七夕相约的怡人。今年的七夕夜,...
写童话故事的作文 写童话故事的作文十篇  在平平淡淡的学习、工作、生活中,大家都接触过作文吧,借助作文人们可以实现文化...
玫瑰花的童话故事作文 玫瑰花的童话故事作文(精选29篇)  无论是在学校还是在社会中,大家都经常看到作文的身影吧,作文是一...
我最敬佩的一个人作文500字... 我最敬佩的一个人作文500字左右初一(精选5篇)  在日常学习、工作和生活中,大家或多或少都会接触过...
童话故事作文400字 童话故事作文400字(精选30篇)  在平时的学习、工作或生活中,大家都写过作文吧,作文是一种言语活...
我的未来作文 【实用】我的未来作文7篇  无论在学习、工作或是生活中,大家一定都接触过作文吧,作文是人们把记忆中所...
在未来作文 在未来作文5篇  在日常生活或是工作学习中,许多人都写过作文吧,写作文可以锻炼我们的独处习惯,让自己...
小学三年级童话故事 小学三年级童话故事300字(精选22篇)  故事:在现实认知观的基础上,对其描写成非常态性现象。是文...
被自己感动的作文 被自己感动的作文(精选8篇)  无论是身处学校还是步入社会,大家都尝试过写作文吧,根据写作命题的特点...
小动物观察日记 小动物观察日记(通用21篇)  一天又结束了,一定会有值得记录的想法吧,这也意味着,又要开始写日记了...
岁月如歌作文 岁月如歌作文(精选15篇)  在学习、工作、生活中,许多人都有过写作文的经历,对作文都不陌生吧,根据...
豆芽生长观察日记 豆芽生长观察日记(通用26篇)  时间如快马般匆匆,一天又过去了,相信大家这一天里都收获颇丰吧,需要...