ForeSpider第三级

第三级

一.链接脚本

创建了“链接抽取”后,点击“链接抽取”,“代码编辑区”变成了“模板脚本”状态。链接脚本可以编写整个链接抽取的脚本。

链接脚本是链接抽取中的脚本,配置了链接脚本,链接的抽取流程将被改变:

1.如果脚本未正确返回dom区域节点,则该链接抽取的规则将完全由该脚本控制。

2.如果脚本返回了一个正确的dom区域节点,则此链接抽取以返回的区域节点为基准,区域外的链接将被过滤掉。

【链接脚本】



二.数据处理脚本

数据抽取层面的脚本有两种,一种是“数据处理脚本”,一种是“数据过滤脚本”。

创建了“数据抽取”后,点击“数据抽取”,在“数据脚本”处选择“数据处理脚本”或“数据过滤脚本”,代码编辑区会变成选择的数据脚本。

【数据处理脚本】

【数据过滤脚本】


(一)数据处理脚本

一旦有了数据处理脚本,则数据过滤脚本将失效。即数据处理脚本必须选择“数据处理”。

数据处理脚本是数据抽取中的脚本, 配置了数据处理脚本,数据的抽取流程将被改变:

1.如果脚本未正确返回dom区域节点,则该数据抽取的规则将完全由该脚本控制。

2.如果脚本返回了一个正确的dom区域节点,则此数据抽取以返回的区域节点为基准,区域外的数据则优先当做垃圾信息处理。

具体配置方法需要参考帮助文档的“脚本”章节。


(二)数据过滤脚本

数据过滤脚本是与数据抽取并列的脚本,它的作用是对抽取的数据,通过脚本进行过滤。

一旦有了数据过滤脚本,则数据处理脚本将失效,即数据过滤脚本必须选择“数据过滤”。