第一章 采集配置

验证码设置

当采集某些网站的数据时,每一条数据都需要输入一条验证码时就用到了验证码设置。

当我们点采集预览时,就会弹出一个验证码的输入框,只有输入验证码才能浏览数据。

【验证码弹出框】

【输入验证码后采集预览结果】

验证码设置的作用是爬虫软件自身输入验证码,以避免人工输入的人工成本。

【验证码设置】

验证码设置操作流程:

【识别平台】

①基础识别平台:

预定的内置识别方式。

②若快:

若快为打码平台。软件通过打码平台解析验证码内容。

【添加识别列表】

1.填写示例地址,此示例地址为测试该打码平台的实例地址,与模板本身的实例地址无关。

2.点击添加按钮添加识别列表。

3.填写识别名称。

4.根据自己配置模板本身的需要选择适合的验证码类型。

5.填写若快账号和密码。若没有账号可以点击注册若快账号进行注册。

【添加验证码识别类】

6.点击保存按钮进行保存。

【保存验证码设置】

其中红框内详情、保存、下载、清空、测试是用来测试验证码是否正确的。点击测试如果右侧验证码图片与图片下解析出来的文字一致,就证明验证码设置的正确。

7.选择验证码识别方式:返回采集设置,点击刷新,选择刚刚配置好的验证码识别列表。然后点击保存。

【选择验证码识别方式】