电信1027
1/3 分步阅读
选择一个视频网站进行采集
2/3
打开八爪鱼采集器,登录账号
3/3
创建采集任务,编辑采集任务及任务组名称,点击“下一步”,开始采集规则的设置
创建翻页循环
1/3
进入采集规则设置界面,将视频网站的URL输入到地址栏,如图点击右侧的按钮,在八爪鱼采集器的内置浏览器中打开该网页
2/3
找到采集的视频站中的翻页按钮,移动鼠标选中,点击右键,
执行红色方框中的“循环点击下一页”选项。操作如图所示
3/3
完成后上述操作后,左侧的流程设计器中显示出一个翻页循环框,翻页循环创建完成,如图所示
创建循环点击列表
1/7
移动鼠标选中视频列表中的标题,点击鼠标右键,
选择红色方框中的“创建元素列表”
2/7
选择添加到列表
3/7
这个元素就会添加到上方的列表中,在执行“继续编辑列表”
4/7
选中视频列表中的第二个视频,同样的方法,
将其添加到元素列表中
5/7
视频列表中的其他视频标题将被抓取到元素列表,这是因为我们添加的是具有两个相似特征的元素,八爪鱼采集器会智能的将页面中其他具有相似特征的元素都添加进来。
点击“创建列表完成”
6/7
如图,点击“循环”
7/7
如图,流程设计器会显示一个点击元素的循环框,完成循环点击列表的创建
抓取视频URL
1/6
移动鼠标到视频标题处,点击右键,
选择执行红色方框中的“抓取这个元素的文本”,对视频的标题进行抓取
2/6
抓取到的标题会显示在右上方的操作框中,
点击“添加其他特殊字段”,
选中“添加当前页面的网址”
3/6
这个视屏的URL就被提取出来了,接着点击右下角的保存按钮
4/6
完成视频URL提取步骤
5/6
由于每一页都需要循环采集数据,所以我们需要将这个循环列表拖入到翻页循环里。
注意流程是从上网页执行的,所以这个循环列表需要放到点击翻页的前面,否则会漏掉第一页的数据。
6/6
完成后的采集规则就如图中红色方框,点击右下方的保存后,就可以点击“下一步”,开始视频URL的采集
开始采集
1/3
选择单机采集,开始视频URL的提取
2/3
采集完成,将视频的URL导出
3/3
将视频URL导出后,使用视频URL批量下载工具将视频下载出来就完成了。
o能量源
把视频链接输入采集器里面就可以下载视频了。