摘要:本文主要介绍Python数据分析--用Python对微博热搜做舆情分析,通过具体的内容向大家展现,希望对大家Python数据分析以及Python爬虫的学习有所帮助。
本文主要介绍Python数据分析--用Python对微博热搜做舆情分析,通过具体的内容向大家展现,希望对大家Python数据分析以及Python爬虫的学习有所帮助。
看微博热搜的时候,发现这样一条热搜。
我寻思,这要真的改了,真的炸锅!所以爬取了这条微博下的数据,进行了一个简单的舆情分析!
一、数据采集
志斌在之前的两篇文章中,详细的介绍了如何获取微博评论,有兴趣的读者可以看看这两篇文章。这里志斌直接展示核心代码了,代码如下:
for page in range(1,10000):
if page == 1 :
params = (
('id', '4654152979845247'),
('mid', '4654152979845247'),
('max_id_type', '0'),
)
#s = requests.Session()
response = requests.get('https://m.weibo.cn/comments/hotflow', headers=headers, params=params)
a = response.json()['data']['max_id']
b = response.json()['data']['max_id_type']
for i in response.json()['data']['data']:
pinglunshijian = i['created_at']
neirong = re.sub(r'<[^>]*>', '', i['text'])
id = i['user']['id']
yonghumingcheng = i['user']['screen_name']
with open(r'71.txt', 'a', encoding='utf-8') as f:
f.write(f'{neirong}\n')
params = (
('id', '4654152979845247'),
('mid', '4654152979845247'),
('max_id', str(a)),
('max_id_type', str(b)),
)
print(f'爬取第{page}页数据......')
time.sleep(random.randint(1,3))
二、可视化分析
我们来对这些数据进行可视化分析。本次绘图使用的是Excel和Tableau两款软件。
1.点赞数top10用户
我们发现椭圆圆子这个用户所发表的评论点赞数最多,有9.5w+,下面让我们看看它的评论是什么,竟然让用户这么喜欢。
这是一句纯吐槽的话,点赞数这么多,可能是因为发的时间早,或者是引起了老师们的共鸣。
2.评论日期分布
从图中我们可以清晰的看出,7.6号发表评论的人数最多,可能跟今天上热搜有关系的原因,毕竟上了热搜,曝光度就高了!
3.评论时间分布
对6号评论发布时间进行分析,我们发现19点发表的评论数量最多,我当时看到这条热搜的时候,基本也是这个时间,看来热搜对一个消息的影响还是很大的。
4.词云图
通过词云图可以看出,人们围绕这寒暑假这个词讨论的非常热烈,学生和取消、行业等词也被大量提及,我翻了翻评论,发现大部分人都是不想取消的。当然志斌也觉得不要取消。
三、小结
1. 通过分析我们可以看出,热搜对每条微博的影响是巨大的。
2. 大家都不太愿意取消寒暑假。
3. 本文仅供学习参考,不做它用。
我是小职,记得找我
✅ 解锁高薪工作
✅ 免费获取基础课程·答疑解惑·职业测评
您输入的评论内容中包含违禁敏感词
我知道了
请输入正确的手机号码
请输入正确的验证码
您今天的短信下发次数太多了,明天再试试吧!
我们会在第一时间安排职业规划师联系您!
您也可以联系我们的职业规划师咨询:
版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
沪公网安备 31011502005948号