预测未来转推活动的基于时间的Hawkes模型

本网页由 小林 亮太(Ryota Kobayashi) Renaud Lambiotte 共同创建,文献发表于ICWSM 2016。

模型的方程

1. 在短时间段 \( [t, t+ \Delta t ] \) 内被转推的可能性

\( \rm{Prob}(\rm{Getting\ a\ retweet\ in}\ [t, t+ \Delta t ])= \lambda(t) \Delta t \)

其中, \( \lambda(t) \) 是转推率。

2. 转推率 \( \lambda(t) \) 由下式给出:

\( \lambda(t)= p(t) \sum_{i: t_i < t} d_i \phi(t-t_i) \),

其中, \( p(t)= p_0 C(t) e^{-(t-t_0)/\tau_m } \) 是基于时间的传播率(infectious rate)。 \( C(t)= 1- r_0 \sin\left( \frac{2\pi}{T} (t- t_p) \right) \) 是时间调节函数(circadian function)。 \( d_i \) 是推特上第i个转推者的粉丝数(followers), \( \phi(t) \) 是记忆函数(memory function)。

 

预测转推情况的示例C语言程序

1. 下载和解压 zip文件.

2. 参数估计:
    输入 "make est "
    输入 "./est_TDH test_RT.txt par.txt 0.0833 T "
其中T是观察时间(小时); \( s_0= 0.0833 \) 是记忆函数 \( \phi(t) \)的一个参数。

3. 预测转推情况:
    输入 "make pred "
    输入 "./pred_TDH test_RT.txt par.txt pred.txt T 0.0833 w "
其中w是预测时间(小时)的组距(bin width)。

文献

Kobayashi R, and Lambiotte R.
TiDeH: Time-Dependent Hawkes Process for Predicting Retweet Dynamics.
ICWSM 2016


如果您有任何问题,或者对改进我们的程序有任何的建议,请联系  小林 亮太.