[TOC] 動(dòng)機(jī) 現(xiàn)有的 PTM 有以下缺點(diǎn): 以預(yù)訓(xùn)練的語(yǔ)言模型為例,它們很好地學(xué)習(xí)頻繁詞的語(yǔ)義,但在受長(zhǎng)尾數(shù)據(jù)分布限制的稀有詞上表現(xiàn)不佳。同...
[TOC] 文本生成任務(wù)的基本定義 從給定的輸入序列生成預(yù)期的輸出序列,稱為序列到序列 (Seq2Seq)。 Seq2Seq 任務(wù)和模型于 20...
Python正則表達(dá)式,請(qǐng)不要再用re.compile了?。?! - 知乎[https://zhuanlan.zhihu.com/p/706804...
當(dāng)我們有多個(gè)選項(xiàng),根據(jù)不同值調(diào)用不同對(duì)象時(shí),不想寫(xiě)很多if—else,就用反射,達(dá)到了動(dòng)態(tài)訪問(wèn)、不寫(xiě)死的效果,高內(nèi)聚、松耦合 反射涉及四個(gè)函數(shù):...
line_profiler function前標(biāo)上 @profile kernprof -l -v aaa.py Line:文件中的行號(hào)。Hit...
涉及兩個(gè)包:官方fasttext包gensim 官方可以下載各種語(yǔ)言的預(yù)訓(xùn)練好的文件但是并不支持finetune,所以下載vec文件后用gens...
References: 圖解Word2vec 經(jīng)典再讀之Word2Vec word2vec Parameter Learning Explain...
ch1 我要做:具體的事 我不要:具體的事 我想做:想打成的目標(biāo) 意志力就是控制這三種。 我要做,是前額灰質(zhì)控制的,晚睡,分心,都會(huì)讓你選擇做更...
機(jī)遇 10000小時(shí)理論,在自己專業(yè)練習(xí)一萬(wàn)小時(shí)則大成,良好的機(jī)會(huì)給有準(zhǔn)備的人,才能抓住機(jī)會(huì)。良好的機(jī)會(huì)也促進(jìn)10000小時(shí)的達(dá)成。 富裕家庭更...