NLP科普文1——應(yīng)用場(chǎng)景

NLP(自然語(yǔ)言處理)分為2類:自然語(yǔ)言理解(NLU)和自然語(yǔ)言生成(NLG)。

自然語(yǔ)言理解(NLU)包括:文本分類、序列標(biāo)注、信息抽取等任務(wù)。

自然語(yǔ)言生成(NLG)包括:機(jī)器翻譯、對(duì)話問(wèn)答系統(tǒng)、自動(dòng)摘要等。

NLG應(yīng)用場(chǎng)景

自動(dòng)摘要

形式:給定輸入的文本,輸出包含輸入文本關(guān)鍵判決信息的摘要內(nèi)容。

要點(diǎn):

1)模型自動(dòng)生成的內(nèi)容完整且精確的覆蓋了原文關(guān)鍵信息

2)生成的內(nèi)容通順流暢

具體應(yīng)用產(chǎn)生場(chǎng)景如:文章摘要生成,會(huì)議紀(jì)要生成,法律/金融(專業(yè)領(lǐng)域)的長(zhǎng)文檔摘要生成。


相似問(wèn)生成

形式:模型針對(duì)輸入問(wèn)句,生成多條意思相近的問(wèn)句。

一般是對(duì)有標(biāo)注的數(shù)據(jù)進(jìn)行語(yǔ)義相似度的訓(xùn)練。所以此解決的是“沒(méi)有相關(guān)標(biāo)注數(shù)據(jù)”的新場(chǎng)景。

一般有兩種方式:1)零樣本學(xué)習(xí);2)自然語(yǔ)言生成技術(shù)擴(kuò)充標(biāo)注數(shù)據(jù)。


相似度由大到小排列??煽闯?,相似度最大的句子完全保留了原句的含義,較小的句子開(kāi)始出現(xiàn)語(yǔ)義的發(fā)散。在實(shí)際使用中,可通過(guò)控制相似度的值來(lái)調(diào)整被選用的生成句子的多樣性。

可控條件文本生成

對(duì)生成文本的感情控制、風(fēng)格切換。

1)風(fēng)格切換

形式:通過(guò)控制風(fēng)格標(biāo)簽,模型可以按照原本的標(biāo)題句式生成出指定語(yǔ)境的標(biāo)題。

示例:

用新聞標(biāo)題作為輸入,而其對(duì)應(yīng)的新聞分類作為控制條件。

2)感情控制

形式:感情遷移,目標(biāo)是讓模型轉(zhuǎn)換輸入文本的感情極性。

示例:

模型能很好地保留原本的句式結(jié)構(gòu)和關(guān)鍵信息,但改變句子的感情極性

數(shù)學(xué)表達(dá)式生成

除了文本,還可以生成代碼、SQL、數(shù)學(xué)表達(dá)式。

生成模型能夠?qū)⒑?jiǎn)單的數(shù)學(xué)應(yīng)用題轉(zhuǎn)化為數(shù)學(xué)表達(dá)式

看圖說(shuō)話

形式:輸入圖片,輸出一段描述圖片的文本內(nèi)容。


待補(bǔ)充。


學(xué)習(xí)參考:
NLG技術(shù):文本生成技術(shù)多樣化應(yīng)用的探索之路https://mp.weixin.qq.com/s/tQ1dHjNnTQTfy7TyxA5Skg

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容