色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

<kbd id="yuigs"></kbd>

<bdo id="yuigs"><th id="yuigs"></th></bdo>

登錄注冊(cè)寫文章

268G+訓(xùn)練好的word2vec模型（中文詞向量）

268G+訓(xùn)練好的word2vec模型（中文詞向量）

??從網(wǎng)上了解到，很多人缺少大語(yǔ)料訓(xùn)練的word2vec模型，在此分享下使用268G+語(yǔ)料訓(xùn)練好的word2vec模型。

訓(xùn)練語(yǔ)料：

百度百科800w+條，26G+
搜狐新聞400w+條，13G+
小說(shuō)：229G+

image.png

模型參數(shù)：

window=5
min_count=10
size=128
hs=1
negative=0
iter=5
ps：其它參數(shù)見gensim庫(kù)，執(zhí)行代碼為：gensim.models.Word2Vec(sentence, window=5, min_count=10, size=128, workers=4,hs=1, negative=0, iter=5)

其它相關(guān)：

分詞詞典使用了130w+詞典。分詞代碼：jieba.lcut(sentence)，默認(rèn)使用了HMM識(shí)別新詞；
剔除了所有非中文字符；
最終得到的詞典大小為6115353；
模型格式有兩種bin和model，使用方式：
a. bin模式：model = gensim.models.KeyedVectors.load_word2vec_format(model_path, binary=True)
b. model模式：model = gensim.models.Word2Vec.load(model_path)
文件壓縮后大小與未壓縮相近，因此未壓縮。

下載鏈接：
鏈接:https://pan.baidu.com/s/1ckkH_eT-WS4SN73Iq9Q_5A 密碼:9aza

最后編輯于：2018.07.21 09:39:13

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點(diǎn)，簡(jiǎn)書系信息發(fā)布平臺(tái)，僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

基于 Gensim 的 Word2Vec 實(shí)踐
模型創(chuàng)建 Gensim中 Word2Vec 模型的期望輸入是進(jìn)過(guò)分詞的句子列表，即是某個(gè)二維數(shù)組。這里我們暫時(shí)使用...
chaaffff閱讀 2,183評(píng)論 0贊 5
Word Embedding: Word2Vec
1. 導(dǎo)入 ??這是語(yǔ)言表示系列的第1篇，主要講述了分布式表示里的Word2vec方法。該系列目前暫定有4篇語(yǔ)言的...
brucep3閱讀 3,369評(píng)論 0贊 5

利用Python實(shí)現(xiàn)中文文本關(guān)鍵詞抽取的三種方法
文本關(guān)鍵詞抽取，是對(duì)文本信息進(jìn)行高度凝練的一種有效手段，通過(guò)3-5個(gè)詞語(yǔ)準(zhǔn)確概括文本的主題，幫助讀者快速理解文本信...
atLee閱讀 22,541評(píng)論 8贊 46
gensim訓(xùn)練word2vec語(yǔ)料庫(kù)初探
NLP技術(shù)已經(jīng)非常成熟，各行各業(yè)都需要有專門的NLP技術(shù)。網(wǎng)上介紹gensim的材料很多，有幾種類型：翻譯，摘錄...
hohoha閱讀 6,828評(píng)論 0贊 1
溫馨的愛（之一）
溫馨的愛（之一）昨天下午，我站在學(xué)校大門口翹首等待女兒的時(shí)候，前面也站著一位像我一樣的媽媽。我注意到了她的頭發(fā)下...
東平糊粥兒閱讀 283評(píng)論 0贊 3

友情鏈接更多精彩內(nèi)容

54贊55贊

3贊賞

手機(jī)看全文

利川市| 墨竹工卡县| 田林县| 昌乐县| 萍乡市| 马边| 东方市| 石楼县| 临湘市| 息烽县| 娄烦县| 长子县| 四平市| 北宁市| 潜山县| 泰宁县| 双城市| 报价| 大英县| 浦东新区| 北辰区| 灵山县| 苏尼特左旗| 牙克石市| 黄梅县| 深水埗区| 平乐县| 双流县| 怀宁县| 湘乡市| 临澧县| 夏邑县| 汉川市| 孝昌县| 岳阳县| 兴化市| 长乐市| 高台县| 攀枝花市| 甘泉县| 漳浦县|

<abbr id="icqo4"></abbr>

<abbr id="icqo4"><input id="icqo4"></input></abbr>

<center id="icqo4"></center>

<bdo id="icqo4"></bdo><pre id="icqo4"></pre><bdo id="icqo4"><th id="icqo4"></th></bdo>

<abbr id="icqo4"></abbr>