请选择 进入手机版 | 继续访问电脑版
 找回密码
 立即注册

快捷登录

搜索

分析牛网页链接提取如何使用,使用帮助说明

管理员 2017-11-29 18:46

核心要点:网页链接提取主要是通过设定好的规则和条件,把页面中的链接,按照符合该规格条件的结果,提取出来。该功能主要用于平时整理一些推广报表,已经发出去的文章,不需要一条一条的去整理,可以批量的提取出来。

如果提取出来的结果只有链接,这边大家也不要担心,提取完后,还可以通过链接标题提取的功能,对标题再一次提取,得到想要的结果。

下面一起看看网页链接提取如何使用:

首先要先声明一下,网页链接提取只是简单的链接提取的功能,并不是所有的页面都适用。能使用的地方,必须页面的地址保持一定的规律性,并且该链接在页面的源代码中以链接的格式出现,才可以提取出来。下面以豆瓣小组为例为大家介绍这个功能。

示例地址:https://www.douban.com/group/325434/discussion?start=0

1、  设置链接地址

链接地址也就是我们要提取链接页面的地址,这里的索要提取页面就是示例地址,因而把示例地址放进去即可,如下图所示。

2、  打开链接地址,选择要提取的网址,并设置提取格式

点击打开,如下图所示,会把当前页面所有的链接提取出来。

设置提取格式

接下去要分析页面中文章页链接的特点,我们先拿几个文章页出来对比下,看看文章页的链接规则是如何的?

https://www.douban.com/group/topic/69102785/

https://www.douban.com/group/topic/65723988/

https://www.douban.com/group/topic/108911370/

从以上三个链接我们可以看到,链接除了最后的数字不同以外,其他前面的网址串都是相同的。所以我们提取格式,就可以填写为:https://www.douban.com/group/topic/(*)/如下图所示。

这里填写完毕后,要点一下提取链接按钮,测试下是否有数据提取出来,所提取出来的结果是否正确,如下图所示。

上图中,所提取出来的数据正是我们想要的文章页标题和链接,那么单页面提取就算大功告成了,下面就可以设置分页。

3、  设置分页

点击右下角的设置按钮,弹出设置窗口页面,设置窗口有4个参数。

分页链接格式:也就是我们列表的链接,分页一定是围绕着某一个数值变化的。

页数:我们要提取分页的页数,这里填写多少数字,就是要提取多少页的内容。

通配符长度:这个是变量参数的长度,也就是(*)的长度。

倍数追加:分页是以多少倍数增加的。

下面我们看一起分析看看这个页面的分页参数是如何提取的。我们先看看分页的格式:

https://www.douban.com/group/325434/discussion?start=0   第一页

https://www.douban.com/group/325434/discussion?start=25  第二页

https://www.douban.com/group/325434/discussion?start=50  第三页

我们会发现这些列表分页中,除了start后面的数字外,其他的都没变,所以0/25/50就是通配符替代的位置,我们要提取10页,通配符的长度自然是1,倍数追加是25。因此我们54个参数分别是:

分页链接格式:https://www.douban.com/group/325434/discussion?start=(*)

页数:10

通配符长度:1

倍数追加:25

填完以后,就可以得到想要的分页的所有地址,如下图所示。

4、  提取所有分页的内容

点击提取,就可以提取出所有的分页内容,下面会展示分页的进度。

5、  谷歌浏览器如何使用浏览器窗口的使用

谷歌浏览器是后面刚刚更新的方式,主要用于所见即所得的模式,因为在前面所介绍的方法中,并没有所见即所得的模式,而在谷歌浏览器中,我们把分析牛的链接提取的模式嵌入到谷歌浏览器中,以做到所见即所得模式。下面一起看看该如何使用

要先设置谷歌浏览器的路径,谷歌浏览器的路径,一般在于:C:\Users\(你的用户名)\AppData\Local\Google\Chrome\Application\chrome.exe

这里一定要记住,路径一定要配置正确,否则你的谷歌浏览器功能将无法使用。如果还没下载谷歌浏览器,可以点击下载谷歌浏览器按钮,进行下载,下载后再进行配置。

设置完成谷歌浏览器的路径后(设置完以后,一定要重启电脑,不然会出现卡顿现象。),就可以点击下面的谷歌浏览器按钮,打开谷歌浏览器,如下图所示。

打开你想要提取的网页,在网页右侧,会出现链接提取的四个选项,提取设置,跟外面的窗口的提取设置是类似的,这里我就不详细介绍,如果不懂的可以看下前面的帮助。

配置完规则后,点链接提取,就可以把链接提取到我们的分析牛主窗口上。

6、  导出所提取的数据 提取完成后,点下面的保存查询结果按钮,即可把数据保存出来。
鲜花
鲜花
握手
握手
雷人
雷人
路过
路过
鸡蛋
鸡蛋
分享至 : QQ空间
收藏
原作者: 中菜 来自: 官方网站

登录后才可以发表评论,或免费注册

  • 梦幻(小贵) 2018-2-25 12:46
    确实没之前的好用,之前能提取的,现在用这个根本提取不了
  • 青舞飞扬 2018-1-3 18:23
    这个没以前的好用哈,以前可以直接下拉,等那些没加载的加载好,虽然有点笨的方法,但有时候临时用用也是很方便的