ForeSpider采集预览错误

采集预览错误

一.检查文档详情

当没有错误提示语,显示测试完成,但是没有出现预想的效果时,点击“文档详情”,会显示采集页面的源代码。

查看源代码,检查有没有出现目标采集结果的源代码内容。如果有,则需要仔细检查配置是否出错。如果没有,说明可视化的采集无法完成,需要写脚本才能实现采集。

【采集预览-文档详情】



二.查看错误提示语

1.频道和模板的配置错误

①输入为空或不合法:频道配置的采集地址为空或不合法。

②模板分类错误:分类器错误。

③地址错误:采集地址不存在或已经失效。

④模板错误:模板不存在或已经损坏。

⑤频道入口配置错误:关键词搜索配置错误。

⑥文档类型错误:采集对象是不能够识别的文档。

⑦频道配置不合法:频道配置错误。

2.http下载错误

①服务器繁忙:采集对象的服务器繁忙。

②域名解析错误:域名解析出现错误。

③网页重定向:采集对象重新定向了新的地址。

④网页未找到:未找到请求资源。

⑤权限访问错误:方法禁止操作或权限不够。

⑥服务器错误:本机服务发生错误。

⑦网络错误:网络发生错误。

⑧https协议错误:ssl错误。

⑨代理服务器错误:代理错误。

⑩内容错误:下载的页面内容发生错误。

⑪用户取消下载:下载过程中用户过滤或取消。

3.文档类型无法识别:文档后缀与实际类型不符。
4.脚本执行出错:脚本配置出错。
5.数据错误:数据库插入、更新、删除、查询等发生错误。
6.未知错误:发生其他各类错误。