ESIM:Enhanced LSTM for Natural Language Inference
创始人
2024-03-07 07:42:31
0

原文链接:https://aclanthology.org/P17-1152.pdf

概述

        对于自然语言推理任务,Bowman等人在2015年提出了一个大数据集,大多数工作就开始使用神经网络来对该任务进行训练。但作者认为序列模型的潜力还没有完全被挖掘,因此提出了一个基于chain LSTMs的序列模型,该模型比先前的模型效果都要好,另外融合循环结构后,性能得到进一步提升,特别是在纳入语法信息后达到了最好的结果。

介绍

        自然语言推理(NLI)中一个任务是RTE(recognize textual entailment),就是判断两个句子之间的关系,存在三种情况:矛盾、无关以及蕴含。实际就是看在给定前提p的情况下,能不能推出假说h。例如以下例子:

        前提p中表示部分航空公司发现即使调整了通货膨胀后成本增长仍高于预期,从中是可以推测出h这个假说的。

        另外,作者认为语法和语义是密切相关的,所以在本文中作者也探究了语法信息对NLP任务的作用,讲语法信息进行编码融入到模型中。

方法

        作者提出的模型结构主要包括:input encoding、local inference modeling和inference composition。如下图所示,左部分就是前面提到的序列模型ESIM(主要是使用语义信息来进行训练),右部分是在tree LSTMs中融合了语法信息的结构(主要是用语法信息来进行训练)。(可以只使用ESIM,也可以达到很好的效果,在加入了右边语法信息的结果后,结果会更好。如果两个模型都使用,作者称为HIM)

         premise a=(a1,,,ala),hypothesis b=(b1,,,blb),通过预训练的模型对其embedding进行初始化,最后得到两个句子逻辑关系之间的label y。

Input Encoding

        作者将双向LSTM(BiLSTM)和Tree-LSTM作为两个模型的基本结构块,但在input encoding部分和inference information部分中有着不同的作用。

        在ESIM中,使用BiLSTM来对输入的句子premise和hypothesis进行编码,文中对BiLSTM的具体结构没有进行具体介绍,实际就是将两个不同方向LSTM的隐状态进行concat作为最终的隐状态,另外作者提到这里使用其他循环记忆块(例如GRUs)进行代替的话,效果没有LSTMs好。

        如下所示,使用\bar{a}_{i}表示BiLSTM对输入句子a在时间步i的隐藏状态,对b也同理。

        对于语法信息,使用树状的LSTM来对节点进行更新。在每个节点中,将向量Xt以及其左右子节点的隐状态作为输入计算该节点的隐向量ht,对于没有叶子的节点,使用{x}'_{t}(类似于unknown word)作为输入。具体结构以及计算公式如下图所示:

 

         其中\sigma表示sigmoid函数,W,U都是可学习的权重矩阵。

 Local Inference Modeling

        感觉这部分就是得到词与词之间的soft attention,ESIM得到词与词之间语义信息的权重,而另一个使用语法信息的模型得到词与词之间语法关系的权重。

        在本文中,计算premise和hypothesis之间的相似度:

         在ESIM中,将上诉相似度eij用于premise中单词的隐状态\bar{a}_{i}和hypothesis中相关的语义信息计算,即使用\bar{b}_{j}中相关的向量来表示\tilde{a}_{i}

         在语法树中,是对PCFG语法分析器(相关链接:使用Stanford Parser的PDFG算法进行句法分析 - 灰信网(软件开发博客聚合))得到局部短语以及从句的关系进行注意力分数计算。与ESIM中差不多,只是将\bar{a}_{i}\bar{b}_{j}(前提和假说中的embedding)替换成tree-LSTM中对应叶节点的隐状态(由公式3计算得到)。

         为了使得元祖中元素之间关系(标签中的三种,矛盾、无关、蕴含)更加明显,作者将\tilde{a}_{i}\tilde{b}_{j}的差值和点积进行与其自身进行concat,对得到的local inference 信息进行增强:

        作者认为这是一种高层次的信息交互,另外,作者也将该元祖作为输入,传入一个前馈神经网络中,将最后一层的隐状态添加到上诉concatenation中,但实验结果表明这并没什么用。

 Inference Composition

        在ESIM中依旧使用BiLSTM对ma和mb的上下文信息进行捕获,计算与前面的公式1和公式2类似。另一个模型中,使用以下公式进行树节点的更新:

        为了减少计算量,这里的F是只有一层带有ReLu激活函数的前馈神经网络。

        最后通过一个pooling层后传入到分类器中对最终结果进行推测,本文中作者使用了avg和max两种pooling方式,如下所示(对于树结构的模型,在公式20中使用根结点的隐状态进行计算):

        整个模型使用多分类的交叉墒损失来进行训练。可以只使用ESIM模型的结果,也可以对两个模型最后的预测结果进行赋权来得到最后的结果。

实验

        本文实验使用Bowman等人在2015年提出的SNLI(Stanford Natural Language Inference)数据集,移除了其中一些无法确定的数据。与之前提出的模型进行对比,实验结果如下:

        作者对模型中的主要部分进行了消融实验,结果如下:

 

        作者对Tree-LSTM和BiLSTM中各个词之间的注意力分数进行了可视化和分析:

  

总结

        本文提出了一个序列模型,在SNLI数据集上达到了目前最好的效果,在结合语法信息后达到效果会更好。作者认为序列模型的潜力害没有完全被发掘出来,未来将进一步探索使用额外信息(例如Word-Net和contrasting-meaning embedding)来帮助词级别的推理关系。

        (不知道为啥,这篇论文看完后花了接近一天的时间来写这篇博客,其实模型也不是很难,可能是我表述能力的问题吧!就是我能大概知道这个模型是怎么训练的,但是跟着论文来写一遍的时候还是会很慢很慢🥹)

参考文献

         论文阅读笔记:文本蕴含之ESIM - 知乎

【文本匹配】之 经典ESIM论文详读_尽量不躺平的kayla的博客-CSDN博客_文本匹配论文     

相关内容

热门资讯

骄傲的感觉真好作文五年级(经... 骄傲的感觉真好作文五年级 篇一骄傲的感觉真好我是一个五年级的学生,今天我想和大家分享一下我为什么觉得...
新的一切,新的梦想作文【通用... 新的一切,新的梦想作文 篇一新的一切,新的梦想人生中,总会有一些时刻让我们感觉到新的一切即将开始,新...
三毛流浪记五年级作文(推荐3... 三毛流浪记五年级作文 篇一我眼中的三毛流浪记小时候,我读过一本叫做《三毛流浪记》的书。这本书讲述了一...
奇遇外星人五年级作文(最新3... 奇遇外星人五年级作文 篇一我与外星人的友谊今天,我要向大家分享一个令人难以置信的故事,那就是我和一位...
愉快假期作文五年级35篇【优... 愉快假期作文五年级35篇 篇一我度过的愉快假期假期终于来临了,我迫不及待地踏上了愉快的假期之旅。这个...
我的奶奶五年级作文500字【... 篇一:我的奶奶五年级作文500字我的奶奶是我最亲近的人之一,她是一位和蔼可亲的老人,也是我心目中的英...
第一次走夜路五年级作文【推荐... 第一次走夜路五年级作文 篇一第一次走夜路昨天晚上,我第一次独自走夜路回家。这是一个令人紧张又刺激的经...
五年级上册语文作文(精彩3篇... 五年级上册语文作文 篇一我最喜欢的动物我最喜欢的动物是熊猫。熊猫是中国的国宝,也是世界上最可爱的动物...
创新想象作文五年级400字2... 创新想象作文五年级400字26篇 篇一标题:未来的交通工具未来,交通工具将发生翻天覆地的变化。现在我...
五年级关于去肯德基作文大全【... 五年级关于去肯德基作文大全 篇一第一篇内容:我对肯德基的喜爱作为一个五年级的学生,我非常喜欢去肯德基...
五年级作文美丽就在我身边40... 篇一:美丽就在我身边五年级作文美丽就在我身边400字作文结尾 篇一通过写这篇作文,我深刻地感受到了身...
小学五年级书的作文400字【... 小学五年级书的作文400字 篇一我的好朋友我有一个好朋友,她叫小芳。她是我班上的同学,我们从一年级就...
漫画老师作文300字五年级上... 漫画老师作文300字五年级上册 篇一我喜欢的漫画老师我们学校有一位非常特别的老师,他就是我们的漫画老...
我的座右铭五年级作文(经典6... 我的座右铭五年级作文 篇一勇敢迎接挑战挑战是生活中不可避免的一部分。无论是学习上的困难,还是生活中的...
小学五年级母爱的作文600字... 小学五年级母爱的作文600字 篇一母爱是最伟大的妈妈是一个家庭中最重要的人,也是最伟大的人。她为我们...
我的妹妹五年级500字作文1... 我的妹妹五年级500字作文12篇 篇一标题:我和妹妹的五年级生活我是一个五年级的学生,而我的妹妹也刚...
小学五年级写信作文400字(... 小学五年级写信作文400字 篇一亲爱的爸爸妈妈:您好!我是你们的儿子,现在正在上小学五年级。我很想和...
杭州乐园游记五年级作文【精简... 杭州乐园游记五年级作文 篇一我喜欢杭州乐园终于盼到了暑假,我和家人一起来到了杭州乐园。杭州乐园是一个...
小学五年级作文博物馆21篇(... 小学五年级作文博物馆21篇 篇一:我的首次博物馆之旅今天,我们班级去了博物馆参观,这是我第一次去博物...
狼与狗的作文五年级【优秀6篇... 狼与狗的作文五年级篇一狼与狗是两种相似又不同的动物。狼是一种野生动物,而狗是人类驯化的宠物。它们在外...