第一章 采集配置

1.4.7 模板取值:同一个网站中从另一页面采集数据

当前字段的取值数据不在当前页面,在另一页面时,需要将该字段的取值类型选择为“模板取值”。用另外一个模板的内容来填充该字段的值。

(注意:模板取值的id不能填自身)。

需要在“标签属性”一栏根据另一个模板的属性填写:

a.超链接:href=[id: ]

b.图片:src=[id: ]

id取另一个模板的id值。在另一页面设置相同名称的字段,即可将另一页面的数据存于本模板的该字段。

如下图:

【案例图片】

像首页---公司介绍---人才招聘---在线留言---联系我们这里边的数据互不包含但是又需要采集在不同页的数据时就可以用模板取值。

我们以人才招聘以及公司介绍两个板块进行模板取值。

第一步:

首先将人才招聘该页网址放在模板的实例地址中,添加数据抽取。之后建表单,该页面中的联系电话、招聘列表均可定位取值,但是公司介绍在该页面取不到。

【人才招聘模板配置】

此时就用到了模板取值。

第二步:

选中gongsijieshao字段,将该字段配置成模板取值,并在标签属性处填写href=[2](因为该标签为链接,所以填写href)

模板取值定位操作:在该字段上定位取值:鼠标选中该字段,按crtl键,鼠标点击“公司介绍”。

第三步:

添加一个公司介绍的模板,添加数据抽取模板,将公司介绍的网址放到该模板的示例地址处。

【公司介绍模板配置】

建公司介绍的表单,该页面需要什么数据可以建什么字段,此例中只建了公司介绍一个字段。其他例子也是一样。采集预览如图:

【模板取值预览】