ForeSpider模板取值

模板取值:从另一页面采集数据

当前字段的取值数据不在当前页面,在另一页面时,需要将该字段的取值类型选择为“模板取值”。用另外一个模板的内容来填充该字段的值。(注意:模板取值的id不能填自身)

需要在“取值标示”一栏根据另一个模板的属性填写src=[id: ]或href=[id: ],id取另一个模板的id值。在另一页面设置相同名称的字段,在“取值标示”处通过填写模板id,连接另一个模板。即可将另一页面的数据存于本模板的该字段。

以某企业信息网站为例:

公司基本信息在“公司介绍”选项卡中。

【企业信息1】

同时,另一部分信息在“联系方式”页面中。

【企业信息2】

为了全面采集数据,再创建一个新的模板,对应“联系方式”的页面数据。

【创建“联系方式”模板】

在“联系方式”模板中,创建数据抽取,点击右键“添加数据字段”,添加了关于联系方式的三个字段。

【创建“联系方式”数据抽取】

照常配置“联系方式”的字段。

【配置“联系方式”数据抽取】

返回“公司信息”的模板,找到“联系方式”的字段。在页面上定位“联系方式”,在“取值类型”处选择“模板取值”。

由于页面上“联系方式”是个<a>链接,属性为href,取值的关联模板“联系方式”的ID为5。因此,在“取值标示”处填写“href=[5]”,完成了该字段的配置。

【配置“公司介绍”字段属性】