一、创新点和主要内容

  • 利用卷积神经网络和注意力机制对推文的文本内容进行编码得出立场预测,使用RNN(双向GRU)和注意力机制对推文序列进行学习,最后结合两个子模型进行谣言的预测。
  • 检测过程分为两步:根据推文的文本内容、时间戳和目标推文的顺序对话结构得出每条推文的stance;然后使用conversation中所有推文的stance来对原始谣言的真假进行预测。

二、模型介绍

1、数据集
  • pheme数据集的一部分
2、立场预测
  • 结合文本表示、上下文表示、时间特性学习得到推文的立场。
- 立场检测架构图

- 文本编码器——得到文本表示(输入到序列编码器、谣言预测子模型)
  • 将一个推文表示为单词的集合{wi};通过嵌入层将推文表示为词向量集合{Vi^^}(使用预先训练好的glove embedding初始化单词向量,训练期间对其进行调优,以捕获特定任务的内在特征);对词向量使用一层卷积层、tanh函数学习特征;进入注意力机制(词向量级别);将所有学习到的词向量特征连接起来,得到推文的文本表示。
- conversation序列编码器——得到上下文表示
  • 从左至右读入文本编码器输出,得到前向序列;从右至左读入文本编码器输出,得到后向序列,由此得到推文的上下文序列(双向GRU模型);通过注意力机制(推文级别的)
-时间信号编码器——获取时间特征
  • 随着时间推移,不同立场评论的比例会发生变化
  • 其时间特性ts编码为源tweet的发布时间与目标tweet的发布时间之间的差异

3. 谣言真实性预测模型
  • stance预测结果+文本表示+soft

更多推荐

2018C-predicting stance in twitter conversation for detecting veracity of rumor