Python采集某购物软件数据信息,轻松拿捏千元外包项目
创始人
2024-02-07 05:07:18
0

前言

嗨嗨,想必知道外包这个词的人应该不少吧

话说,接外包有多的也有少的,少的几十,多的emm上限我就不说了,嘿嘿

今天要不要来看看一个千元的外包项目?

是采集某购物软件的一些数据信息

咋说,有点吸引力吗,有的话就好好学python,赶紧接外包挣钱吧

请添加图片描述

selenium

Selenium 是一个 Web 的自动化测试工具,最初是为网站自动化测试而开发的,就像玩游戏用的按键精灵,可以按指定的命令自动操作。

Selenium 测试工具直接操控浏览器中,就像真正的用户在操作一样。Selenium 可以根据的指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏,或者判断网站上某些动作是否发生等。

模块安装

源码.资料.素材.工具安装包.点击领取即可

pip install selenium

谷歌驱动下载地址:

https://npm.**.org/mirrors/chromedriver/
http://chromedriver.storage.googleapis.com/index.html

配置浏览器驱动:

将下载好的浏览器驱动解压,将解压出的 exe 文件放到Python的安装目录下,也就是和python.exe同目录即可。

或者

把驱动和代码放在同一个路径里面

确定目标网页

请添加图片描述

爬取内容:

商品价格
商品名字
销量
店铺名字
发货地

1.获取搜索框元素,输入想要搜索的内容

这里咱们呢搜索女士包包的关键词

driver.find_element_by_css_selector('#q').send_keys('女式包包')

2.获取搜索按钮元素,点击搜索

driver.find_element_by_css_selector('.search-button').click()

3.会弹出登陆页面

方案一:

  • 获取账号和密码元素,用代码输入
  • 合理设置好延时,并不会出现验证码

方案二:

  • 获取支付宝登陆元素,点击手动扫码登陆

请添加图片描述

这边选择方案二,方案一是可行的,但是会账号密码,所以这个你们可以自己去尝试

driver.find_element_by_css_selector('#login-form > div.login-blocks.sns-login-links > a.alipay-login').click()

请添加图片描述

4.获取商品列表页数据

在这里插入图片描述

和普通爬虫解析网站数据一样的~获取列表页标签,然后再二次提取。

这里创建一个字典,接收数据,方便等会保存到csv文件。

源码.点击领取即可

lis = driver.find_elements_by_css_selector('#mainsrp-itemlist .item')
python学习交流Q群:770699889 ###
dit = {}
for li in lis:time.sleep(1)price = li.find_element_by_css_selector('.ctx-box .price strong').text + '元'  # 商品价格dit['商品价格'] = pricedeal = li.find_element_by_css_selector('.ctx-box .deal-cnt').text      # 成交量dit['成交量'] = dealrow = li.find_element_by_css_selector('.ctx-box .row-2 a').text      # 商品名字dit['商品名字'] = rowshop = li.find_element_by_css_selector('.shop > a > span:nth-child(2)').text      # 店铺名字dit['店铺名字'] = shopcity = li.find_element_by_css_selector('.row-3 > div.location').text      # 发货地址dit['发货地址'] = city

5.保存数据

最后一步就是保存数据了,基本操作了

python学习交流Q群:770699889 ###
f = open('淘宝数据.csv', mode='a', encoding='utf-8-sig', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['商品价格', '成交量', '商品名字', '店铺名字', '发货地址'])
csv_writer.writeheader()
csv_writer.writerow(dit)

6.翻页点击下一页

def next_page():driver.find_element_by_css_selector('#mainsrp-pager > div > div > div > ul > li.item.next > a').click()driver.implicitly_wait(10)

7.运行效果图

在这里插入图片描述

在这里插入图片描述

最后

今天的分享到这里就结束了

给大家推荐一些Python视频教程,希望对大家有所帮助:

Python零基础教学合集

对文章有问题的,或者有其他关于python的问题,可以在评论区留言或者私信我哦
觉得我分享的文章不错的话,可以关注一下我,或者给文章点赞(/≧▽≦)/

请添加图片描述

相关内容

热门资讯

《夏至未至》经典台词句子 《夏至未至》经典台词句子  导语:《夏至未至》是由上海辛迪加影视有限公司出品,根据郭敬明所著同名小说...
挪威的森林经典句子 挪威的森林经典句子  无论是身处学校还是步入社会,大家都看到过许多经典的句子吧,不同类型的句子具有不...
对人失望的句子精选996句 对人失望的句子 精选110句1. 一个女人喜欢一个男人时,她希望听到谎言;当一个女人厌恶一个男人时,...
美丽蜕变的句子精选579句 美丽蜕变的句子 精选107句1. 有时候,城市太大,门槛太多,她和他一个人走了很远。2. 如果有一天...
描写小庭院优美的句子精选18... 描写小庭院优美的句子 精选66句1. 游人如果到当地农家作客,通常都会受到热情的款待,品尝酥油茶,喝...
让男人看了内疚的句子精选31... 让男人看了内疚的句子 精选53句1. 我不是冷血,更不是慢热。我只是害怕,投入太多,离开的时候会难过...
自己内心矛盾的句子精选181... 自己内心矛盾的句子 精选104句1. 如果,最后在身边的真的不是你。如果你经历了那么多的起起落落,最...
赞美校园保洁的句子精选115... 赞美校园保洁的句子 精选102句1. 你们用汗水与辛劳挥舞着手中笨拙的扫帚,给校园一个整洁的容貌,给...
环境描写死气沉沉句子精选98... 环境描写死气沉沉句子 精选69句1. 教室中死气沉沉,同学们个个都泪流满面,惟有几位同学装作一脸苦笑...
一生能遇到的句子精选420句 一生能遇到的句子 精选63句1. 选择你所爱的,然后爱你所选择的。2. 你的温柔,我懂,你的疼爱,我...
诚信的句子 有关诚信的句子大全  诚信是一种美德,会让你更加完美。下面是小编整理的有关诚信的句子大全,欢迎阅读!...
时间过得快的搞笑句子精选26... 时间过得快的搞笑句子 精选132句1. 我们不可能都成为英雄。2. 要找出时间来考虑一下,一天中做了...
你好六月的优美句子 你好六月的优美句子(精选100句)  在学习、工作或生活中,大家都听说过或者使用过一些比较经典的句子...
怀念好句子大全要短的精选38... 怀念好句子大全要短的 精选35句1. 小学同学聚会能聚这么多人真的不容易,好怀念以前小的时候现在大家...
有哲理的唯美句子精选76句 有哲理的唯美句子 精选50句1. 池塘边的榕树上,还有知了在声声叫着;家门口的小路旁,还有小狗在快乐...
自我独特的个性签名 自我独特的个性签名(精选70句)  不管现实多么惨不忍睹,都要持之以恒地相信,这只是黎明前短暂的黑暗...
人类破坏环境污染句子精选30... 人类破坏环境污染句子 精选64句1. 排放的气息,是乌云盖天的狂欢;森林的骤减,是沙漠扩展的心愿;灾...
繁体字情侣个性签名   繁体字情侣个性签名  1、討厭自己想刺猬一樣小心防備。討厭自己想小丑一樣假冒開心。  2、如果決...
抖音名字 抖音名字▼※目录※▼抖音名字(1-100个)抖音名字(101-200个)抖音名字(201-300个)...
爱情的经典个性签名 关于爱情的经典个性签名集锦  1、其实只要两个人幸福就好了,何必在乎别人的眼光和议论。  2、距离让...