实例教程4 如何用爬一爬数据采集器抓取爱奇艺风云榜数据?

本文主要介绍了如何用爬一爬数据采集器抓取爱奇艺风云榜数据 。
爬图标与爱奇图标
1.首先在爬一爬官网下载爬插件 。
下载谷歌浏览器插件
2.点击浏览器工具栏右侧按钮->更多工具->扩展程序 。或在地址栏中输入 chrome://extensions/
安装爬一爬数据采集器插件
3.把下载好的插件拖入浏览器中“扩展程序”的页面,点击“添加扩展程序”,这样插件就安装完成了 。“爬”标志出现在右侧插件栏 。
添加扩展程序
4.确保账号已登录,打开要采集的网站浏览器没有工具栏 , 点击浏览器插件栏的“爬”图标,启动插件 。
5.打开爱奇艺风云榜网站,依次点击选取所要抓取的元素 , 如果色彩框没有包含所有的任务数据, 点击切换按钮,切换算法 , 直到选中所有的任务数据 。#本例采用的是js-engine
6.确认色彩框选中全部数据,先点击“完成”按钮,再点击“测试”按钮 , 测试所采集的数据是否就是您想要的采集的 。
【实例教程4 如何用爬一爬数据采集器抓取爱奇艺风云榜数据?】测试任务
7.确认测试成功后,点击”OK”按钮关闭测试窗口 。填写任务名称(长度为4-32的字符,必填),并根据个人需要修改列名 。
8.点击“提交”按钮,创建任务 。
9.任务创建成功后,在官网该任务”管理”处添加起始链接浏览器没有工具栏,可抓取网址不同但页面结构相同的数据 。#注:本例抓取了四个页面的数据(热播榜/ 电视剧风云榜/ 动漫风云榜/ 综艺风云榜)
管理任务
添加起始链接
10.点击“运行”按钮,运行任务 。
运行任务
11.任务运行结束后,点击官网“任务”页面的“数据”选项即可查看并下载数据 。#注:可根据url区分不同类型的数据 。
查看数据
#【Tips】
如果起始链接较多 , 可选择批量上传 。(只接收*.txt文件 。每行一个URL,文件最大为200K)
本文到此结束,希望对大家有所帮助!

猜你喜欢