一、介绍
系统采集微博话题文章和评论数据,利用senta框架提供的预模型进行情感分析,对话题的关机键词、热度、地区进行分析,使用了tfidf、textrank等算法。
二、系统功能
1、话题中心
展示我们系统中所爬取到的话题信息,包括阅读次数、讨论人数、原创人数等。
2、微博舆情
展示爬取到的文章信息及文章舆情分析信息(使用 百度情感分析senta模型分析舆情指数,舆情指数小于45分为绿色,45分-60分为橙色,大于60分为红色)。
3、舆情地图
以地图的形式,直观的展示各个省份舆情信息,可以选择具体某个话题查看。
4、关键词分析
针对某一个话题 ,使用 textrank和tfidf分别提取话题关键词,以饼图和环形图的形式展示出来。
5、数据分析
以旭日图的形式展示各个话题正负面舆情占比。
6、热度分析
用时间热度图展示各个时期各个话题热度。
7、词云分析
使用jieba、wordcloud等库,对各个话题的文章和评论关键词进行分析,生成词云图。
8、个人信息
用户查看、编辑个人信息、用户登录后可修改密码。
三、软件架构
后端
- python
- flask
前端
- vue
- iview
- echarts