预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

在线社交网络影响力分析社交影响力的相关因素 社交网络影响力的度量方法 社交网络中影响力的传播 总结与展望摘要社交影响力分析是社交网络分析的关键问题之一。近十几年间,随着在线社交网络的蓬勃发展,研究人员才开始有机会在大量现实数据的基础上对社交影响力进行建模和分析,并取得了丰硕的研究成果和广泛的应用价值。文中阐述了社交影响力的相关概念和它们之间的关系,重点从网络拓扑、用户行为和交互信息等几个方面总结了影响力分析的建模和度量方法,并对在线社交网络影响力分析的前景进行了展望。社交影响力的相关因素同质性 同质性指具有相似特征的个体选择彼此作为朋友的倾向,即所谓的“物以类聚,人以群分”。如果用户B发现用户A和自己有相同的兴趣和爱好,因而选择A作为自己的朋友,这种现象即是同质性的表现。互惠性等其他因素 社交影响力除了受到同质性的影响,还有很多因素都会对影响力分析结果产生影响,比如互惠性、活跃度、同时性、异质性、环境因素和关联效应等。 上述因素中的互惠性指的是用户在社交过程中出于礼貌或习惯等原因对其他用户的行为给予相应回应的现象。例如,社交网络中,用户B申请作为A的好友,A在接受请求后出于礼貌又申请作为B的好友,这种投桃报李的现象就体现出互惠性。 社交网络的外部因素也会对影响力和信息传播产生作用。例如,研究发现YouTube上的有些视频信息能以很快的速度传播开来,而这类现象可以用视频信息受到的外部影响进行解释。社交网络影响力的度量方法基于社交网络拓扑结构的度量 对社交网络进行影响力分析时,网络结构中的节点表示用户,而节点之间的连接则表示用户之间建立的关系,它们在分析影响力时都起着至关重要的作用,因此我们分别以网络节点和连接为对象介绍一些广泛使用的度量方法。 在下文中,社交网络的拓扑结构用图G=(V,E)表示,如无特别说明,一般是指无向图。其中n=|V|表示节点数; 表示节点i;表示节点i和j之间的边,很多时候也被称之为连接;表示图的邻接矩阵;是其中的元素;如果是带权图,我们用表示节点i和j之间的权重。 节点的度量连接的度量 对连接的影响力度量即是对两个用户相互之间影响程度的度量。 一般而言,两个节点的邻居重叠程度越高,这两个节点之间的关系越紧密,它们之间的影响力也越强烈,可以用Jaccard相似度度量这种关系: Jaccard相似度用于统计节点i和j的共同邻居在总邻居数中所占比例。 边介数也可用于度量边在网络中的重要程度: 边介数统计的是网络中经过边的最短路径的总数量。 博客图:用有向多重图表示节点间的影响力,弧的重数越多代表节点间的影响力越强,弧的方向表示影响力的作用方向。 影响力图:该图是有向带权图,弧的方向表示影响力来源,权重代表影响力强度,用表示从节点u到节点v之间的平行边条数,其计算方式为 基于用户行为的度量 一般情况下,在线社交网络都会记录人们通过交互活动产生的大量信息,其中就包括各种用户行为数据。通过分析这些数据,可以衡量用户之间的影响大小及其传播途径和范围,还可以据此建立用户之间的社交关系网络。网络日志是一种重要的用户行为数据来源,Goyal等人利用日志信息分别计算了用户和动作自身的影响力: 其中,u和v表示不同用户;a表示动作;表示动作之间的时间间隔;是时间常量;表示动作在用户之间的传播;表示用户u产生的动作数量;U(a)表示执行动作a的用户数量,与基于网络拓扑的节点影响力度量方法不同,上述模型以动作的传播频率作为用户影响力评估指标,并用动作的执行范围度量动作本身的影响力指标。 基于用户交互信息内容的度量 由于用户的社交影响力能够促进信息的传播,所以分析在线社交网络中信息内容的传播范围和时间,能够比较准确地反映用户的影响力。 在社交网络中,很多传播广泛的流行消息都是由影响力较大,拥有大量粉丝的用户发起的,因此流行消息的传播可以作为用户社交影响力的判断依据。P(k)表示用户在经受k次曝光后才开始使用该标签的概率,图中曲线表示实验数据集中最流行的500个标签的P(k)值的平均分布。 从图中可以间接证明时间因素在影响力度量中的重要作用。社交网络中影响力的传播处位置的重要程度。如果用户在社交网络中的位置能够如实体现他在社交活动中的领袖地位,利用基于PageRank算法的排名方法就能对其进行度量。 基于网络结构的方法过分强调了意见领袖的“领袖”特点,即在社交网络中地位显赫,而忽视了他发布“意见”的重要性。因此分析用户所发信息的影响力及其传播特性,能够更客观准确地发现网络中的意见领袖。博客中的意见领袖可以根据他发布的有影响力的帖子数量进行识别,利用博文的引用数量、评论数量、新颖程度和内容长度评价帖子的影响力,从而发掘出意见领袖。通过观察和分析用户网络用户的行为特征及其传播规律,也能对用户的影响力