INTELLIGENT TEXT CLASSIFICATION

单层级单维度分类

对一篇文章进行一个维度一个层级的分类。例如对新闻网站的新闻类别分类,对政府网站的行业政策分类,对新闻评论、商品评价的情感方向分类等。ForeSpider数据采集分析系统可以对采集的数据,在采集的同时直接分类,将分好类的数据做好分类标记,存入爬虫自带的数据库中。

  • 智能文本分类实施案例

    ——让数据 “自由”的流动,充分利用和发挥数据价值。

    • 招投标信息分类

      对招投标信息需要区分招标、中标、变更、拟建等公告类型,又要区分标讯地区对应的全国各省市区县,还需要对标讯进行行业分类。ForeSpider数据采集分析系统可以对采集的招投标数据,在采集的同时对公告类型、地区、行业同时进行分类标记,数据采集入库的同时,可以对标讯数据完成上述分类。

  • 智能文本分类实施案例

    ——让数据 “自由”的流动,充分利用和发挥数据价值。

    • 商品评论分类

      采集电商平台手机商品的评论数据,需要对评论信息进行好评、差评分类,还需要区分是对产品质量、价格、商家服务、物流配送的哪一方面进行的评论,还需要对手机的差评数据区分维度,比如差评是针对像素、外观、电池、显示屏等具体哪部分评价的。ForeSpider数据采集分析系统可以在采集商品评价数据的同时,完成上述复杂的多维度多层次分类。

LABEL CLASSIFICATION

多类别标签分类

可以使同一数据同时符合多个主题分类,以打标签的形式对数据进行分类标记。例如一段对服装类商品评价可以同时包含对材质、款式、图案、价格的评论内容,一篇新闻可以包含多个名人出席的标签,一个新政策可以体现出对多个行业的利好利空消息。ForeSpider数据采集分析系统可以在采集数据的同时,对数据进行多标签分类识别。