WORD CLOUD

词云图表

利用大文本分词、多维度筛词以及自定义词典技术对数据内容进行词频统计生成词云图表。以更加客观地方式展现已有的文本数据,直观传递关键信息,使乏味的的文本散发活力。

前嗅词云图

Speed
案例1.统计指定关键词的词频
事先列举出需要统计的关键词列表,采集数据后,统计列表中的关键词出现的次数。例如采集新闻网站的新闻正文内容,按照事先准备好的关键词列表统计正文中出现的词频并排序。
案例2.统计文本的高频词
不需要事先列举需要统计的关键词,直接在采集数据后统计正文中所有词的出现次数,将排名较高的词汇统计显示出来。缺点是会有很多常用词语会出现在高频词列表中,建议使用后文的“统计文本的高频词并屏蔽指定词”方式统计。
案例3.统计文本的高频词并屏蔽指定词
不需要事先列举需要统计的关键词,但需要事先列举出不需要进行统计的关键词库,比如一些常用词语。例如采集财经新闻,可以屏蔽掉“股市”、“公司”、“证券”等常用财经词汇,会更加突出真正有用的高频词。