2020寒假,QA論文小總結(jié)

主要看了20篇近三年的頂會(huì)QA相關(guān)文章
大致分為幾類:

  • 特定領(lǐng)域的問答系統(tǒng),如法律、醫(yī)療等
  • 基于文本閱讀理解的QA研究
  • 基于知識(shí)圖譜、知識(shí)庫的QA研究
  • 整合文本和KB的QA研究
  • 提出新的QA數(shù)據(jù)集
  • 中文相關(guān)

特定領(lǐng)域問答系統(tǒng)

WestSearch Plus: A Non-factoid Question-Answering System for the Legal Domain

本文是一個(gè)Demo Paper
本文作者提出了一個(gè)非事實(shí)問題的問答系統(tǒng),該系統(tǒng)可為法律領(lǐng)域中用戶輸入的問題提供法律上準(zhǔn)確、與司法管轄區(qū)相關(guān)并可以通過對(duì)話進(jìn)行答復(fù)的答案。 這種商用系統(tǒng)完全基于NLP和IR,并且不依賴于結(jié)構(gòu)化的知識(shí)庫。 WestSearch Plus旨在為有關(guān)法律的基本問題提供簡潔的一句話答案。 它的范圍不限于特定主題或管轄范圍。 潛在答案的語料庫包含大約2200萬份文檔,這些文檔分類為超過12萬個(gè)法律主題。
其主要流程就是對(duì)問題進(jìn)行關(guān)鍵詞提取,然后通過現(xiàn)有的法律搜索引擎進(jìn)行搜索,之后再對(duì)搜索到的結(jié)果進(jìn)行關(guān)鍵信息的提取,用的都是現(xiàn)成的模型

A Hierarchical Attention Retrieval Model for Healthcare Question Answering

在醫(yī)療信息在線平臺(tái)中導(dǎo)航以回答醫(yī)療保健消費(fèi)者的特定查詢是一項(xiàng)艱巨的任務(wù)。大多數(shù)此類查詢本質(zhì)上可能不是事實(shí)類問題,因此,傳統(tǒng)的基于關(guān)鍵字的檢索模型不適用于此類情況。此外,在許多情況下,可能希望獲得一個(gè)簡短的答案以充分回答該查詢,而不是一個(gè)僅包含少量有用信息的冗長文檔。在本文中,作者提出了一種神經(jīng)網(wǎng)絡(luò)模型,用于對(duì)醫(yī)療保健領(lǐng)域中的問題回答文檔進(jìn)行排名。所提出的模型在單詞,句子和文檔級(jí)別使用了一種深層關(guān)注機(jī)制,以便在各種長度的文檔上有效檢索事實(shí)和非事實(shí)查詢。具體來說,單詞級(jí)別的交叉注意使模型可以識(shí)別與查詢最相關(guān)的單詞,而句子和文檔級(jí)別的層次注意則允許它對(duì)長文檔和短文檔進(jìn)行有效檢索。作者還構(gòu)建了一個(gè)新的大規(guī)模醫(yī)療保健問答數(shù)據(jù)集,用于評(píng)估模型。

本文提出的模型名叫Hierarchical Attention Retrieval (HAR)模型,使用的是深度注意力機(jī)制



如圖所示,本模型的主要特點(diǎn)是使用了交叉注意力機(jī)制來結(jié)合問題和文檔的聯(lián)系



從結(jié)果來看,HAR模型比目前許多baseline模型額效果都要好得多,提升非常明顯

基于文本閱讀理解的QA研究

Efficient and Robust Question Answering from Minimal Context over Documents

用于文檔的問題解答(QA)的神經(jīng)模型已經(jīng)實(shí)現(xiàn)了顯著的性能改進(jìn)。 盡管有效,但由于這些模型在文檔和問題之間的相互作用很復(fù)雜,因此無法擴(kuò)展到大型語料庫。 并且這種模型對(duì)對(duì)抗性輸入很敏感。 在本文中,作者研究了回答問題所需的最小上下文,并發(fā)現(xiàn)現(xiàn)有數(shù)據(jù)集中的大多數(shù)問題都可以用少量的句子來回答。 受此觀察的啟發(fā),提出了一個(gè)簡單的句子選擇器,以選擇最少的句子集輸入到QA模型中。


本文主要的貢獻(xiàn)在于,對(duì)于document很龐大的數(shù)據(jù)集,使用了sentences selector來選擇其中最為關(guān)鍵的幾個(gè)用來回答問題的句子,來改進(jìn)正確率和效率。實(shí)驗(yàn)表明這種方法非常有效

Document Gated Reader for Open-Domain Question Answering

基于深度學(xué)習(xí)的QA方法存在以下缺陷:

  • 遠(yuǎn)程監(jiān)管數(shù)據(jù)的質(zhì)量較差,并且答案得分在多個(gè)文檔中未標(biāo)準(zhǔn)化。
  • 與以前的開放域問答系統(tǒng)不同,它們獨(dú)立處理每個(gè)文檔,這可能會(huì)忽略上下文中的寶貴信息。


這篇文章解決的問題就在于將不同的document的關(guān)系也加入到了尋找答案的要素之中。
提出了一個(gè)document gate 的操作,用來獲取document之間的關(guān)聯(lián),具體見論文中的模型。
并且作者使用了IR模型來進(jìn)行問題相關(guān)document的檢索、本文做了比較大量的實(shí)驗(yàn)
DGR在大多測(cè)試中都有著最好的表現(xiàn)

Multi-Hop Paragraph Retrieval for Open-Domain Question Answering

本文涉及多跳開放域問答(QA)的任務(wù)。 這項(xiàng)任務(wù)特別具有挑戰(zhàn)性,因?yàn)樗枰瑫r(shí)執(zhí)行文本推理和有效搜索。 作者提出了一種方法,用于檢索嵌套在大型知識(shí)庫中的多個(gè)支持段落,其中包含必要的證據(jù)來回答給定的問題。 作者的方法通過形成問題和段落的聯(lián)合向量表示來迭代地檢索支持圖。 檢索是通過考慮知識(shí)源中段落的用語篇表達(dá)的句子表達(dá)來執(zhí)行的。 作者的方法在兩個(gè)著名的數(shù)據(jù)集SQuAD-Open和HotpotQA上達(dá)到了最先進(jìn)的性能,它們分別作為我們的單跳和多跳開放域QA基準(zhǔn)


本文主要研究多文本的多跳查詢問題,亮點(diǎn)就在于本文提出模型的Reformulation層,使得多跳的每一次查詢的查詢向量獨(dú)特,如下圖所示


Reading Wikipedia to Answer Open-Domain Questions

本文建議使用Wikipedia作為唯一知識(shí)源來解決開放域問題的回答:任何事實(shí)類問題的答案都是Wikipedia文章中的文本范圍。 大規(guī)模的機(jī)器閱讀任務(wù)將文檔檢索(查找相關(guān)文章)與機(jī)器理解文本(識(shí)別這些文章的答案范圍)的挑戰(zhàn)結(jié)合在一起。 我們的方法將基于bigram哈希和TF-IDF匹配的搜索組件與經(jīng)過訓(xùn)練以檢測(cè)Wikipedia段落中的答案的多層遞歸神經(jīng)網(wǎng)絡(luò)模型相結(jié)合。 我們?cè)诙鄠€(gè)現(xiàn)有質(zhì)量檢查數(shù)據(jù)集上的實(shí)驗(yàn)表明,(1)兩個(gè)模塊相對(duì)于現(xiàn)有模塊都具有很高的競(jìng)爭力,(2)使用遠(yuǎn)程監(jiān)督對(duì)其組合進(jìn)行多任務(wù)學(xué)習(xí)是完成這一艱巨任務(wù)的有效完整系統(tǒng)
模型分為兩個(gè)部分,第一部分是document檢索部分,用于檢索與問題相關(guān)的文章,之后在通過document閱讀器來進(jìn)行文章信息的提煉


retriever主要是TF-IDF的運(yùn)用,閱讀器運(yùn)用了比較火的注意力機(jī)制的文本閱讀理解模型。這篇文章開辟了一個(gè)QA的新領(lǐng)域,即開放域QA的研究
本文解決的問題是Machine Reading at Scale,使用維基百科作為唯一知識(shí)源,提出了一種解決開放式問題的方法,使得機(jī)器能以更加靈活的方式回答問題。這個(gè)大規(guī)模機(jī)器閱讀 (machine reading at scale MRS) 的任務(wù)結(jié)合了文件檢索(找相關(guān)文章)和機(jī)器文本理解(識(shí)別答案所對(duì)應(yīng)文本)。相比較于單任務(wù)學(xué)習(xí),使用多任務(wù)學(xué)習(xí) (multitask learning) 和distant supervision可以在多個(gè)任務(wù)上實(shí)現(xiàn)性能提升

Question Answering through Transfer Learning from Large Fine-grained Supervision Data

這篇主要運(yùn)用的方法就是遷移學(xué)習(xí),把span-level的數(shù)據(jù)集上的預(yù)訓(xùn)練模型運(yùn)用于sentence-level可以有很不錯(cuò)的效果。
作者的研究表明,問題解答(QA)的任務(wù)可以大大受益于在不同的大型,細(xì)粒度QA數(shù)據(jù)集上訓(xùn)練的模型的轉(zhuǎn)移學(xué)習(xí)。 通過SQuAD的基本遷移學(xué)習(xí)技術(shù),作者在兩個(gè)經(jīng)過充分研究的QA數(shù)據(jù)集WikiQA和SemEval-2016(任務(wù)3A)中達(dá)到了最先進(jìn)的水平。 對(duì)于WikiQA,該模型比以前的最佳模型高出8%以上。這篇文章證明了,通過定量結(jié)果和視覺分析,比起粗略的監(jiān)督,更好的監(jiān)督為學(xué)習(xí)詞匯和句法信息提供了更好的指導(dǎo)。 我們還表明,類似的轉(zhuǎn)移學(xué)習(xí)程序可以在一項(xiàng)附帶任務(wù)上達(dá)到最新水平

BERT with History Answer Embedding for Conversational Question Answering

會(huì)話搜索是信息檢索社區(qū)中一個(gè)新興的話題。多回合會(huì)話搜索的主要挑戰(zhàn)之一是對(duì)會(huì)話歷史進(jìn)行建模以回答當(dāng)前問題?,F(xiàn)有的方法或者將歷史記錄放在當(dāng)前問題之前,或者使用復(fù)雜的注意力機(jī)制來對(duì)歷史記錄進(jìn)行建模。提出了一種概念上簡單但高效的方法,稱為歷史答案嵌入。它可以將對(duì)話歷史記錄無縫集成到基于BERT(來自變壓器的雙向編碼器表示)構(gòu)建的對(duì)話問題回答(ConvQA)模型中。



本文主要是BERT在QA、多輪對(duì)話領(lǐng)域中的運(yùn)用,強(qiáng)調(diào)了對(duì)話歷史信息對(duì)于QA的作用。結(jié)果表明這樣的模型有一定的提升,但是提升不是特別顯著

基于知識(shí)圖譜、知識(shí)庫的QA研究

An End-to-End Model for Question Answering over Knowledge Base with Cross-Attention Combining Global Knowledge

隨著網(wǎng)絡(luò)上知識(shí)庫(KB)的快速增長,如何充分利用它們變得越來越重要?;谥R(shí)庫的問題解答(KB-QA)是訪問大量知識(shí)的有前途的方法之一。同時(shí),隨著基于神經(jīng)網(wǎng)絡(luò)(基于NN)的方法的發(fā)展,基于神經(jīng)網(wǎng)絡(luò)的KB-QA已經(jīng)取得了令人印象深刻的結(jié)果。但是,以前的工作并沒有更多地關(guān)注問題表示,并且無論其候選答案如何,問題都會(huì)轉(zhuǎn)換為固定向量。這種簡單的表示策略很難表達(dá)問題中的正確信息。因此,作者提出了一種端到端的神經(jīng)網(wǎng)絡(luò)模型,通過交叉注意機(jī)制,動(dòng)態(tài)地根據(jù)各種候選答案方面來表示問題及其相應(yīng)的分?jǐn)?shù)。


本文的創(chuàng)新之處在于針對(duì)問題的表示做了比較多的關(guān)注,并且將問題和候選答案聯(lián)系起來,動(dòng)態(tài)的表示問題,這樣能夠使得問題的表示更加具有意義,使得問題的回答更加準(zhǔn)確

Querying NoSQL with Deep Learning to Answer Natural Language Questions

如今,幾乎所有知識(shí)都存儲(chǔ)在數(shù)據(jù)庫中,因此只能在領(lǐng)域特定的查詢語言的幫助下進(jìn)行訪問,從而極大地限制了可以訪問數(shù)據(jù)的人員的數(shù)量。 在本文的工作中,作者演示了一個(gè)端到端的可訓(xùn)練問題解答(QA)系統(tǒng),該系統(tǒng)允許用戶使用自然語言來查詢外部NoSQL數(shù)據(jù)庫。 這種系統(tǒng)的主要挑戰(zhàn)是數(shù)據(jù)庫操作的不可區(qū)分性,我們通過應(yīng)用基于策略的強(qiáng)化學(xué)習(xí)克服了這一難題。 我們?cè)贔acebook的bAbI電影對(duì)話數(shù)據(jù)集上評(píng)估了我們的方法,與幾種基準(zhǔn)模型相比,我們獲得了84.2%的競(jìng)爭得分。 我們得出結(jié)論,我們的方法在知識(shí)駐留在外部數(shù)據(jù)庫中且中間標(biāo)簽的成本太高而無法收集非端到端可培訓(xùn)QA系統(tǒng)的現(xiàn)實(shí)世界場(chǎng)景中表現(xiàn)出色


本文的特點(diǎn)主要在于使用了強(qiáng)化學(xué)習(xí)來進(jìn)行模型的學(xué)習(xí)。這項(xiàng)工作將AI技術(shù)(即基于注意力的指針網(wǎng)絡(luò))與完善的NoSQL數(shù)據(jù)庫Elasticsearch集成在一起。 我們的端到端可訓(xùn)練的硬KB查找SeqPolicyNet模型優(yōu)于“電影對(duì)話”數(shù)據(jù)集上的幾個(gè)基線模型。 如果為每個(gè)問題類別提供足夠的樣本,SeqPolicyNet甚至可以對(duì)訓(xùn)練期間看不見的問題模式進(jìn)行泛化

整合文本和KB的QA研究

Answering Complex Questions by Joining Multi-Document Evidence with Quasi Knowledge Graphs

直接回答涉及多個(gè)實(shí)體和關(guān)系的問題對(duì)于基于文本的質(zhì)量檢查是一個(gè)挑戰(zhàn)。當(dāng)只能通過結(jié)合多個(gè)文檔中的證據(jù)才能找到答案時(shí),這個(gè)問題最為突出。策展的知識(shí)圖(KGs)可能會(huì)產(chǎn)生很好的答案,但受到其固有的不完整性和潛在的陳舊性的限制。本文介紹了QUEST,這種方法可以通過計(jì)算來自不同文檔的部分結(jié)果的相似性連接,直接從文本源中直接回答復(fù)雜問題。我們的方法完全不受監(jiān)督,避免了訓(xùn)練數(shù)據(jù)瓶頸,并且能夠應(yīng)對(duì)用戶問題中快速發(fā)展的臨時(shí)主題和公式化樣式。 QUEST使用節(jié)點(diǎn)和邊緣權(quán)重構(gòu)建一個(gè)嘈雜的準(zhǔn)KG,由動(dòng)態(tài)檢索的實(shí)體名稱和關(guān)系短語組成。它通過類型和語義對(duì)齊來擴(kuò)充該圖,并通過Group Steiner樹算法計(jì)算最佳答案。作者根據(jù)復(fù)雜問題的基準(zhǔn)對(duì)QUEST進(jìn)行評(píng)估,并證明它大大優(yōu)于最新的基準(zhǔn)
在文章中作者還指出了基于KB和文本的問答系統(tǒng)的優(yōu)缺點(diǎn)進(jìn)行了一個(gè)總結(jié)。
本文主要是將文本和KB進(jìn)行結(jié)合來回答復(fù)雜的問題,通過OPENIE來構(gòu)建一個(gè)知識(shí)圖譜進(jìn)行結(jié)合

Improving Question Answering over Incomplete KBs with Knowledge-Aware Reader

作者提出了一種新的端到端問題回答模型,該模型學(xué)習(xí)從不完整的知識(shí)庫(KB)和一組檢索到的文本摘要中匯總回答證據(jù)。 在假設(shè)結(jié)構(gòu)化知識(shí)庫更易于查詢并且獲得的知識(shí)可以幫助理解非結(jié)構(gòu)化文本的假設(shè)下,我們的模型首先從與問題相關(guān)的知識(shí)庫子圖中積累實(shí)體的知識(shí); 然后在潛在空間中重新編寫問題,并閱讀具有積累的實(shí)體知識(shí)的文本。 最終將KB和文本的證據(jù)匯總起來以預(yù)測(cè)答案。 在廣泛使用的KBQA基準(zhǔn)WebQSP上,我們的模型在不同程度的KB不完整程度之間實(shí)現(xiàn)了持續(xù)改進(jìn)


本文的特色在于把KB和Document結(jié)合,這邊是分別兩個(gè)reader來處理KB和document,最后用兩者得到的信息來預(yù)測(cè)最后的答案

提出新的QA數(shù)據(jù)集

ELI5: Long Form Question Answering

作者引入了第一個(gè)用于長篇問答的大型語料庫,這是一項(xiàng)需要對(duì)開放式問題進(jìn)行詳盡而深入的回答的任務(wù)。 該數(shù)據(jù)集包含來自Reddit論壇“像我一樣五歲的孩子”(ELI5)的270K線程,其中一個(gè)在線社區(qū)提供了對(duì)五歲孩子可以理解的問題的答案。 與現(xiàn)有數(shù)據(jù)集相比,ELI5包含需要多語句答案的各種問題。 作者提供了大量的網(wǎng)絡(luò)文檔來幫助回答問題。 自動(dòng)和人工評(píng)估表明,經(jīng)過多任務(wù)目標(biāo)訓(xùn)練的抽象模型優(yōu)于傳統(tǒng)的Seq2Seq,語言建模以及強(qiáng)大的抽取基線。 但是,作者的最佳模型仍然離人類表現(xiàn)還差得遠(yuǎn),因?yàn)樵u(píng)估者在超過86%的情況下更喜歡黃金反應(yīng),從而為未來的改進(jìn)留有充足的機(jī)會(huì)。

下圖是一個(gè)例子

DuReader: a Chinese Machine Reading Comprehension Dataset from Real-world Applications

見數(shù)據(jù)集整理

中文相關(guān)

Lattice CNNs for Matching Based Chinese Question Answering

短文本匹配經(jīng)常面臨兩個(gè)文本之間存在巨大的詞不匹配和表達(dá)多樣性的挑戰(zhàn),在像中文這樣的語言中,由于沒有自然的空間來明確地分割詞,這種情況會(huì)進(jìn)一步加劇。 在本文中,作者提出了一種新穎的基于格網(wǎng)的CNN模型(LCN),該模型利用了單詞格網(wǎng)中固有的多粒度信息,同時(shí)保持了強(qiáng)大的能力來處理引入的基于匹配的中文雜音信息。 作者對(duì)基于文檔的問答和基于知識(shí)的問答任務(wù)都進(jìn)行了廣泛的實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,LCN模型可以通過更好地利用以下優(yōu)勢(shì)而大大勝過最新的匹配模型和強(qiáng)大的基準(zhǔn) 從單詞點(diǎn)陣輸入中提取豐富但有區(qū)別的信息的能力。



這篇文章主要解決了中文問答系統(tǒng)中對(duì)于單詞不能很好匹配的問題,使用了詞網(wǎng)格這一技術(shù),對(duì)中文單詞匹配做了優(yōu)化,根據(jù)詳細(xì)的實(shí)驗(yàn)可以得出,論文所提出的詞網(wǎng)絡(luò)的粉刺方法有著更好的效果。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容