ForeSpider模板配置流程

模板配置流程

用户在进行模板配置之前,先浏览该网站,观察如何从入口页点击到数据页。中间经历了几层页面,就对应着创建几个模板;各个页面之间如何连接,就对应着模板之间的关联情况。从每一层级选择一个有代表性的网址,作为该模板的示例地址。

模板的配置步骤如下: 创建模板->输入示例地址->链接页:(创建链接抽取->选择关联模板->地址/标题过滤);数据页:(创建数据抽取->选择表单->字段取值)。

【模板配置流程】

例如淘宝首页作为一个入口页,某类商品列表作为链接页,某商品详情作为数据页,模板的配置关系如下:

模板 类型 描述 示例地址 抽取类型 关联情况
模板一 入口页 淘宝首页 https://www.taobao.com 一个链接抽取:分类列表 模板二
模板二 链接页 商品列表 https://s.taobao.com/list?spm=a21bo.50862.201867-links-0.4.f42Jqp&q=%E6%AF%9B%E8%A1%A3&cat=16&style=grid&seller_type=taobao 两个链接抽取:[商品列表]和[翻页] [商品列表]关联模板三;[翻页]关联模板二
模板三 数据页 商品详情 https://item.taobao.com/item.htm?spm=a219r.lm874.14.122.oFiedu&id=540780593215&ns=1&abbucket=15 数据抽取 商品-表单