第一章 采集配置

1.2.2 链接抽取节点

【添加链接抽取】

软件默认为模板一添加了一个链接抽取。

1.链接抽取的作用:

①抽出链接:抽取出当前页面的全部链接。

②过滤链接:去掉不需要的链接。

③跳转到下级页面:模拟网页跳转的逻辑,通过选择“关联模板”,跳转到其他层级页面(也就是跳转到其他模板)。

2.过滤链接的方式:
方式 适用情况 操作
填写过滤串 链接地址或链接标题有规律 在下级的地址/标题过滤节点,结合过滤串,去掉无关链接。
浏览器定位 所需链接集中在一小片区域 在链接抽取节点,按Ctrl在内置浏览器上点击(扩大选区按Shift),选中所需链接的区域。

链接抽取节点的配置内容:

1 链接抽取名称 修改当前链接抽取的名称。
2 关联模板(必填) 点击该链接,将要跳转到哪层级页面,就选择关联哪一个模板。
3 链接类型 ①href:默认选项,适用于超链接、按钮、CSS文件。
②src:适用于视音频、图片、JS文件。
4 优先运行 在这里可以开启是否优先运行。