ForeSpider第四级

第四级

一.过滤脚本

点击“地址过滤”或“标题过滤”,“过滤类型”选择“脚本过滤”,“代码编辑区”变成了“过滤脚本”状态。过滤脚本可以编写地址或标题过滤的脚本。

过滤脚本是链接(标题)过滤中的脚本, 过滤类型必须选择脚本过滤时过滤脚本才能生效,过滤脚本用于处理复杂的链接或标题过滤需求。

【过滤脚本】

“过滤类型选择“正则过滤”时,在“过滤脚本”处可输入正则表达式。

二.字段取值脚本

在“数据抽取”的表单里选择某个字段,“取值类型”选择“脚本取值”,“代码编辑区”变成了“字段取值脚本”状态。这一步是通过脚本来获取字段的填充值。

注意:一旦有了字段取值脚本,则字段处理脚本将失效。

【字段取值脚本】

三.字段处理脚本

在“数据抽取”的表单里选择某个字段,“字段处理”选择“脚本处理”,“代码编辑区”变成了“字段处理脚本”状态。这一步是通过脚本进一步把需要的数据清洗干净。

【字段处理脚本】