ForeSpider评论

评论

评论信息大多是table表格形式的,一行是一条数据。采集表格数据时,由于各行都在同一个页面上,所以主键字段不能选择“网页主键”。一般有三种方式:

1.字段取值类型为“空”,字段属性选择“主键字段”、“自动字段”。

2.表格有独特的序列特征时,以该特征作为主键,字段属性选择“选区内全部文本”,字段属性选择“主键字段”。

3.用脚本编写一个id的特征。

序号 字段名 取值类型 变量类型 字段属性 字段长度 扩展主类型 扩展子类型 字段描述
1 comm_id (空) Long 索引字段;键值唯一;主键字段;自动字段 0 NONE NONE 评论ID
2 pro_name 选区内全部文本 String 64 NONE NONE 产品名称
3 score 选区内全部文本 Integer 0 NONE NONE 评分
4 author 选区内全部文本 String 64 NONE NONE 评论人
5 context 选区内全部文本 String 0 文本 小量文本(<64k) 评论正文
6 comm_time 选区内全部文本 String 32 NONE NONE 评论时间
7 get_time 网页获取时间 Long 0 时间 日期时间 采集时间