论文: Transition-based Directed Graph Construction for Emotion-Cause Pair Extraction. C Fan, C Yuan, J Du, L Gui, M Yang, R Xu. ACL 2020 [pdf] [code]
现有问题:
现有pipeline框架中情绪识别和原因提取分分开进行的,存在误差传播的问题
解决方法:
提出了一种基于转换的模型,将任务转换为类似解析的有向图构建过程。
该模型基于有时序的一系列操作,增量式地生成有向图,通过这个过程可以同时识别情绪及其对应的原因,使相互独立的任务联结在一起,最大化的利用任务之间的相互依赖性。
工作与贡献:
-
通过学习基于转换的框架,将端到端的情绪原因对提取任务转换为类似解析的有向图结构过程的任务
-
通过联合学习框架可以同时提取情绪和对应的原因,并且一般情况下具有线性的时间复杂度
模型结构:
输入:情绪文本 dnl =(c1, c2, ..., cn) (子句流)
输出:搜索最佳操作序列 Aml = (a1, a2, ..., am)
构建的有向图
有向图的构建
解析器
解析器 S = (σ; β; E; C; R)
σ; β; 为不相交列表成为堆栈和缓冲器,分别存放已被处理的和待处理的节点的指针。
E 是情绪集合,C 是原因集合,R 是目前已生成的边的集合;
另外,A 是操作历史的列表。
操作定义
-
SHIFT (SH) :当 β 不为空时, 弹出 β0 然后压入 σ 的栈顶。因为 β0 可能是 β 中下一个节点的原因
-
RIGHT-ARClt (RAlt):给 σ1 到 σ0 分配一个因果边 lt , 然后把 σ0 复制到集合 E,σ1 复制到集合 C, 删除 σ 中的 σ1(删除原因);
-
LEFT-ARClt (LAlt) :给 σ0 到 σ1 分配一个因果边 lt ,然后把 σ1 复制到集合 E,σ0 复制到集合 C, 删除 σ 中的 σ0(删除原因);
-
RIGHT-ARCln (RAln) :给 σ1 到 σ0 分配一个非因果边 ln , 然后把 σ0 从 σ 中弹出并插入到集合 E;
-
LEFT-ARCln (LAln) :给 σ0 到 σ1 分配一个非因果边 ln ,然后把 σ1 从 σ 中弹出并插入到集合 E;
-
CYCLE-ARC (CA) :为 σ0 分配一个自循环边 lt ,然后把 σ0 复制到集合 E 和 C
操作限制
-
只有当堆栈 σ 中的元素的大于等于2值,左右操作才可以执行
-
当 σ| σ1 | σ0 均为情绪且不为原因时,RIGHT-ARCln 将会被执行
-
实际上,CYCLE-ARC 操作可能会与其他操作有冲突,例如, σ0 是自己的原因,也是 σ1 的原因时,就会与 LEFT-ARClt (LAlt) 操作有冲突。解决方法是,专门训练一个二分类器来识别 σ0,将它分离出来。
对一个文本操作的标准过程
注:$ 结束标识符
转换原理
对给定子句流,搜索最佳操作序列 A*
其中,At-1 是历史操作序列集合, at 由第 t 步生成,St+1 是执行 at 操作后更新的系统状态。rt 作为系统表示,用来计算第 t 步生成 at 的概率,
wa 是可学习的参数向量,ba 为偏置项;A(S) 为到目前解析器状态的所有合法操作的集合。最后的优化函数如下:
至此,ECPE 任务就被融合为一个基于转换的操作预测任务。
为提升解码效率,使用贪心策略,每次都选取最大概率的操作,直到解析过程结束。
解析器原理
解析器状态的表示
初始状态
结束状态
对第 t 步, 使用双向 LSTM 获取特征表示
σt = (... ; σ1; σ0)
βt =(β0; β1; ...)
对于At = (... ; at-2; at-1) ,使用查找表映射到一个离散值 ai, 然后用单项 LSTM 获取特表示
相对距离 d 也是使用查找表映射到一个离散值 ed 。
操作反转
将输入句子序列反转逆序,然后再用解析器再执行一次有向图的构造
rt 、r^ t 分别表示正向和反向操作
训练目标
通过基于转换的框架的学习,将训练数据的最佳输出结构转化成预定义操作的最佳序列,目标函数可以转换成如下公式
a^t 为反向操作,p(ct | s0t) 为自循环边的可预测概率,λ 为 L2 正则系数,θ 表示所有可训练的参数。在训练时的解码中,仅 rt 和 S0t 用于预测下一个操作。
数据集
数据集来自 Rui Xia and Zixiang Ding. 2019 ,统计情况如下
实验结果
实验结果如下:
更多推荐
论文解析 Transition-based Directed Graph Construction for Emotion-Cause Pair Extract
发布评论