微博话题热度预测研究:热搜榜的重要影响不容忽视

佚名 次浏览

摘要:摘要:微博作为目前最受欢迎的移动社交软件之一,俨然已成为社会网络舆论的焦点。在当今社会,关注度就是财富密码,有了大量的关注,人们就可以从中获取各种各样的利益

概括:

微博作为最受欢迎的手机社交软件之一,已成为社交网络舆论关注的焦点。在当今社会,注意力就是财富的密码,拥有大量的注意力,人们可以从中获得各种好处,但也给不法分子提供了可乘之机,如传播虚假新闻、实施网络暴力等。因此,许多学者对微博话题热度的预测方法进行了深入研究,也为社会舆论监督、微博平台网络营销等提供了助力。然而,目前几乎所有关于微博话题热度预测的研究都忽略了微博话题热搜榜对话题热度的重要影响。很多时候,一个话题能否进入热搜榜对其热度发展有着至关重要的影响。进入热搜榜的话题可以获得巨大的曝光量,可能导致其未来热度持续飙升。未能进入热搜榜的话题,即便前期拥有一定的热度电子游戏,之后也很有可能迅速下滑。本文重点研究了微博话题热搜榜这一微博中的重要机制。 它基于话题的极早期数据,预测该话题未来是否能够进入热搜榜,并在此基础上预测进入热搜榜的话题是否能够发展成为热门话题。本文首先对影响微博话题热度的因素以及话题热搜榜的特点进行了深入的研究和分析。通过大量的统计分析,本文发现大多数话题在首次出现在热搜榜时,一般都有20-40条微博或用户参与讨论,其中不乏意见领袖。然后本文基于从微博平台收集到的4804个话题,共计192160条微博进行实验分析自助火锅,并利用本文改进的基于多元复杂时间序列特征提取与数据挖掘模型的方法对话题热度进行预测。实验结果表明,本文方法比原方法取得了更高的预测准确率。最后口才,本文还分析了对话题热度预测起到重要作用的特征。

本文主要创新点如下:第一生活方式,以往研究主要倾向于预测某一话题在未来某一特定时刻的流行程度微博热搜,准确率并不是很高人民日报社,这样的研究在现实生活中意义不大。本文研究了以往研究中被忽视的微博热搜榜的重要机制,将话题流行度分为无法上热搜榜的话题、上热搜榜但流行度一般的话题、上热搜榜且流行度较高的话题三个等级,并对其进行预测。第二生活感悟,在现有的研究中,预测方法大致可以分为三类:基于热度时间序列的相似度比较方法、基于热度时间序列的离散分解与数据挖掘模型方法、基于影响因素的多元特征提取与数据挖掘模型方法。本文所采用的方法属于第三类笑话视频,并在以往研究的基础上对其特征提取方法做了一些改进。以往文献主要采用多元简单描述统计特征提取方法平面模特,无法让模型充分学习到话题数据的时间序列特征。 本文采用的多元复杂时间序列特征提取方法游戏引擎,如排列熵、近似熵、线性回归分析、自回归系数、一阶差分平均数等,可以充分提取主题数据的非线性、周期性、波动性、不可预测性等特征,从而提高模型的预测精度。第三,此外,本文还增加了一些以前研究中没有使用过的新特征益智游戏,例如用户的微博认证类型、微博等级和阳光信用等级,以及主题文本是否包含“回应”、“语音”、“声明”等关键词。这些特征的加入有助于提取更多有帮助的信息。

展开 

随机内容