今年NLP 領(lǐng)域出現(xiàn)了一個比較火的模型叫SimCSE[https://arxiv.org/abs/2104.08821],文章的全稱是Simpl...
最近在nlp領(lǐng)域chatgpt可謂是火的一塌糊涂,主要是其驚艷的效果,讓大家折服。首先筆者簡單介紹一下chatgpt的訓(xùn)練過程:(1) 利用gp...
今天筆者帶來一個企業(yè)級的以圖搜圖的實戰(zhàn)教程。其主要目的是學(xué)習一下以圖搜圖如果產(chǎn)品化后,需要用到一些什么樣得數(shù)據(jù)存儲,數(shù)據(jù)檢索工具。此項目技術(shù)選項...
最佳AI作畫師火遍全球,其效果和想象力直逼人類藝術(shù)家,但是基本上都是英文的AI作畫師居多。今天筆者介紹一下如何通過十行代碼搭建屬于你自己的中文A...
今天筆者來介紹另一個推薦召回領(lǐng)域比較經(jīng)典的算法YotubeDNN[!https://dl.acm.org/doi/abs/10.1145/295...
推薦系統(tǒng)發(fā)展至今,已經(jīng)形成了一個相對穩(wěn)定的鏈路。先召回(粗排)——>再排序(重排)。主要原因是隨著推薦數(shù)量的變大,需要先通過召回從億萬級別的推薦...
信息抽取是自然語言處理界中比較廣泛研究以及應(yīng)用的一個領(lǐng)域,用專業(yè)的學(xué)術(shù)表達就是將文本這中非結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)化。因為計算機對于非結(jié)構(gòu)化的信息處理起...
如今深度學(xué)習領(lǐng)域有一個比較熱門的領(lǐng)域叫做:多模態(tài)。多模態(tài)這個詞整得比較玄學(xué),但是其實主要思想就是將文本,圖像,語音等不同類型的數(shù)據(jù),放到同一個特...
今天學(xué)習一個新的自然語言處理任務(wù)——文本糾錯。文本糾錯這個領(lǐng)域其實有細分成很多不同的類型:如下圖所示 其中不同的問題需要采取不同的策略進行解決。...