ForeSpider脚本 extractor类

extractor 类

extractor 类为采集引擎操作类,管理当前的采集入口,采集属性配置.

一.类成员:无

二.成员方法:
方法名称 返回值 是否静态 方法描述 参数表
GetRoot() channel 返回当前采集器的频道根节点
Insert(parent,prev) channel 在当前采集器上插入一个频道节点 parent:父频道节点
prev:前一频道节点[可以为0]
Delete(item) int 在当前采集器上删除一个频道节点 item:删除节点
GetById(channId) channel 通过采集ID获取频道 channId:频道ID
Iter(func,hand) void 对当前采集器进行频道遍历 func:遍历回调函数(extractor,item,hand)
hand:传入参数
OpenDoc(item,addr_or_keyForm,postData="",header=0) grabDoc 用当前采集节点打开一个文档(必须与CloseDoc成对使用) item:一个采集器的频道节点[channel],频道脚本用this,其它地方用CHANN
addr_or_keyForm:打开地址或者class="vartypestd">keyForm对象[keyForm对象时,postData参数忽略]
postData:post数据(如果为Post)
header:写入http协议头数据[该参数为一个对象{refer:"指定refer地址",cookie:"cookie数据"}]
CloseDoc(doc) int 关闭打开的采集文档 doc:打开的文档
GetSchema(nameID) schema 返回当前采集引擎的一个表单 nameID:指定表单名称或者表单ID
GetDataTable(nameID) dataTable 返回当前引用的数据存储表 nameID:指定采集表单名称或者表单ID
GetSearch(item) keySearch 返回一个采集节点的关键词搜索对象 item:指定采集节点
Submit(results) int 提交数据到数据库,成功返回true results:指定要提交的结果集
TaskPlus(size) int 通知采集引擎任务已经增加[更新任务显示] size:增加数目
TaskSub(size) int 通知采集引擎任务已经减少[更新任务显示] size:减少数目