《改进SIR 模型在社交网络信息传播中的应用》仿真实现

摘要

基于《改进SIR 模型在社交网络信息传播中的应用》一文中提出的改进SIR模型,使用Matlab进行了仿真实现。另外,基于原文的模型,依据实际话题热度进行了其它仿真和分析。


背景

信息在社交网络中的传播方式与传染病在人群中的传播方式存在一定的相似性。将经典的传染病SIR模型进行改进,构建基于改进SIR的社交网络信息传播模型,并以某社交网络实际数据为样本,对模型进行仿真研究,对研究信息在社交网络中的传播机制及传播规律具有重要的实际意义。
本文基于论文《改进SIR 模型在社交网络信息传播中的应用》1中构建的模型,进行了Matlab仿真与分析。上述论文的数据来源于2012年第五届“认证杯”数学建模网络挑战赛C题“碎片化趋势下的奥运会商业模式”。原题部分题干摘录如下:
2012年1月26日,一个名为 Jamie Beck 的 Tumblr 博主发布了一张“海怪号”帆船在沃尔沃环球帆船赛上乘风破浪的照片,随后他收到了 2.5 万条互动信息,其中 60% 是转发这张照片。Jamie Beck是这艘船的赞助商Puma聘请的推广作者,Puma预计,鉴于Beck有200万粉丝,这张照片最终可能获得 600 万至 700 万品牌印象度(Impressions,衡量到达率的指标之一),而 Instagram 上会达到 4000 万。在整个沃尔沃帆船赛中, Puma一共派了 10 位这样的作者去比赛地点阿布扎比,他们在Twitter、 Instagram和Tumblr上更有针对性地发布与Puma,“海怪号”相关的内容。2


改进的SIR模型

社交网络信息传播有自己的不同之处。近年来随着网络技术的发展,网络推手应运而生。网络推手是指借助网络媒介进行策划、实施并推动特定对象,使之产生影响力和知名度的人,对象包括企业、品牌、事件以及个人等。网络推手具有强大的信息传播能力,其数量相对固定。网络推手在社交网络中作为热传播节点存在,设其接触率为 λ1 ,网络中可以传播信息的普通用户称为普通传播节点,设其接触率为 λ2
与经典SIR模型不同,社交网络中,移出节点并不一定由传播节点转化而来,用户得知消息的同时,可能会选择停止转发,直接转换为移出用户;只有选择转发的用户才会转化为传播节点,之后再(以一定概率)转化为移出节点。而且在实际情况中,主动转发的用户往往是少数人。
结合上述考虑,含热传播节点的社交网络的信息传播规则可表述为:(1)社交网络中热传播节点以接触率 λ1 与网络中其他节点有效接触,普通传播节点以接触率 λ2 与其他节点有效接触。(2)易感节点接收传播节点的信息后,转化为可能的信息传播者,依据其对信息所持态度,以免疫概率 μ 转化为移出节点,以 1μ 的传播概率转化为普通传播节点。(3)信息在社交网络中不断传播,最终3类节点所占比例将趋于稳定。其传播模型如下图所示。
改进SIR模型1
图中 i0 表示社交网络中热传播节点所占的比例,其值一般是固定的;i(t)表示t时刻普通传播节点所占比例,由 i1(t) i2(t) 两部分组成,其中 i1(t) 表示由热传播节点产生的普通传播节点, i2(t) 表示由普通传播节点产生的新的普通传播节点; λ1(t) 表示热传播节点的接触率; λ2(t) 表示普通传播节点的接触率; r(t) 表示移出节点所占的比例; μ 表示免疫概率;社交网络中用户的总数量为 N
方程为

ds(t)dt=λ1i0s(t)λ2i(t)s(t)di(t)dt=(1μ)[λ1i0s(t)+λ2i(t)s(t)]dr(t)dt=μ[λ1i0s(t)+λ2i(t)s(t)s(t)+i(t)+r(t)+i0=1i0=i10,i(t)=i20,s(0)=i0,r(0)=r0

注:此处原论文有笔误。

仿真及分析

Tumblr注册用户约2000万,网络推手的日接触率为500人,普通用户的日接触率为20人,结合1中题干描述可知

λ1=500
λ2=20
传播概率 1μ=1500020000000=0.75
免疫概率 μ=99.25
热节点所占比例 i0=1020000000=5×107
设初值为 s0=1,i(0)=0,r(0)=0

使用Matlab R2016a仿真,代码如下:

%SIRModel.m
function y=SIRModel(t,x,lambda1,lambda2,mu,i0)
y=[-lambda1*i0*x(1)-lambda2*x(1)*x(2),(1-mu)*(lambda1*i0*x(1)+lambda2*x(1)*x(2)),mu*(lambda1*i0*x(1)+lambda2*x(1)*x(2))]';

%Command Window
>> ts=0:1:100;
lambda1=500;
lambda2=20;
mu=0.9925;
i0=5e-7;
x0=[1,0,0];
[t,x] = ode45(@(t,x) SIRModel(t,x,lambda1,lambda2,mu,i0), ts, x0);
plot(t,x(:,1),t,x(:,2),'.',t,x(:,3),'*');
xlabel('时间/天');
ylabel('比例');
legend('易感节点','传播节点','移出节点');
title('λ1=500,λ2=20,μ=99.25%');

仿真结果如下:
仿真1
其中,传播节点数量较小,在上图中看不明显,但也有变化,其单独做图如下。
仿真2
在第70天时,移出节点已占到了97.66%,说明有97%的用户已经被传播到,3类节点数量基本稳定,信息传播过程结束。可以看出,信息在0~10天内传播较慢(传播节点数量有限),在20~30天内缓慢增加在30~60天内非常迅速(传播节点也迅速增加),60天之后趋于平缓。
然而,以70天就传播消息是不现实的。根据《2015年9月份微博热门话题报告》3估计,微博话题的热度大多数在7天左右。易知,减小免疫概率,增加传播节点的日接触率,提高热传播节点数量,都可以加速信息传播的速度。下面,单独改变一个变量,来观察什么程序下,可以使上述话题在7天内覆盖到几乎全体用户。

1.降低免疫概率

4
由上图可知,当免疫概率降至90%左右时,话题在7天内可以覆盖到全体用户(易感节点数量接近0)。也就是说,接触到该信息的用户中有10%会主动转化。当然了,现实中的营销活动转化率是难以做到如此之高的。

2.提高热传播节点的日接触率

5
由图可知,如果只有10个热传播节点,那么每个节点都必须是可以有效传达一百万用户的“超级热”节点,对于模型中总用户2000万来说,这是不现实的。当然,如果考虑到运营方也参与进来,这的确有可能实现。

3.提高热传播节点数量

6
由图可知,若热传播节点的日接触率仍为500,需要有200000个热传播节点才能在7天左右实现全覆盖,即在该模型中要有1%的热传播节点,然而现实中,“大V”总是极少数的人,1%也是很困难的数字。总体来看,若要针对热传播节点做改进,既要提升数量,也要把握粉丝数众多的“超级大V”。

4.提高普通节点的日接触率

7
由图可知,普通用户日接触率要达到250,即热传播节点的一半才能达到上述效果。

总体而言,单纯提高某一指标,想要达到7天全覆盖的结果,显然是困难的。这也说明一个热门话题的出现需要多方面因素的加成,在数据庞大的自媒体时代,想要吸引眼球,迅速传播信息是十分具有挑战性的。

当然,现实中热门话题更需要看重精准到达用户(尽管有些话题的受众十分广泛,几乎就是社交媒体的主流使用人群),未必非要实现全覆盖。另外,现实中的热门话题不仅仅是这样自有传播出现的,社交媒体的热搜榜、热点推送等高权限的传播手段,相当于一个超大的热传播节点,起到了重要的推波助澜的作用。

参考文献

1 李可嘉, 王义康.改进SIR 模型在社交网络信息传播中的应用[J].电子科技,2013,26(8),168-171
2 数学中国网. 2012第五届“认证杯”数学建模网络挑战赛C题. http://wenku.baidu.com/link?url=zARL_TmbnBnVjHTBsmwfEgDBHli9jUqwzrKpziiRHugEDkLdGo8GRVHLWZSzCKmh7mgIE_ZZX5GKBOBErh57aZXhDw-z4oXeMqX8sWeoKC.
3 新浪微博数据中心.2015年9月份微博热门话题报告. http://data.weibo.com/report/reportDetail?id=290


阅读更多

更多精彩内容