色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

登錄注冊寫文章

代碼人生的記憶---2018-07-12

代碼人生的記憶---2018-07-12

def textParse(bigString):

? ? import re

? ? listOfTokens = re.split(r'\W*', bigString)

? ? return [tok.lower() for tok in listOfTokens if len(tok) > 2]

def spamTest():

? ? docList = []; classList = [];fullText =? []

? ? for i in range(1,26):

? ? ? ? wordList = textParse(open('email/spam/%d.txt' % i).read())

? ? ? ? docList.append(wordList)

? ? ? ? fullText.extend(wordList)

? ? ? ? classList.append(1)

? ? ? ? wordList = textParse(open('email/ham/%d.txt' % i).read())

? ? ? ? docList.append(wordList)

? ? ? ? fullText.extend(wordList)

? ? ? ? classList.append(0)

? ? vocabList = createVocabList(docList)

? ? trainingSet = range(50); testSet=[]

? ? for i in range(10):

? ? ? ? randIndex = int(random.uniform(0, len(trainingSet)))

? ? ? ? testSet.append(trainingSet[randIndex])

? ? ? ? del(trainingSet[randIndex])

? ? trainMat = []; trainClasses = []

? ? for docIndex in trainingSet:

? ? ? ? trainMat.append(setofWords2Vec(vocabList, docList[docIndex]))

? ? ? ? trainClasses.append(classList[docIndex])

? ? p0V, p1V, pSpam = trainNB0(array(trainMat), array(trainClasses))

? ? errorCount = 0

? ? for docIndex in testSet:

? ? ? ? wordVector = setofWords2Vec(vocabList, docList[docIndex])

? ? ? ? if classifyNB(array(wordVector), p0V, p1V, pSpam) != classList[docIndex]:

? ? ? ? ? ? errorCount += 1

? ? print('the error rate is:', float(errorCount)/len(testSet))

spamTest()

def calcMostFreq(vocabList, fullText):

? ? import operator

? ? freqDict = {}

? ? for token in vocabList:

? ? ? ? freqDict[token] = fullText.count(token)

? ? sortedFreq = sorted(freqDict.iteritems(), key=operator.itemgetter(1), reverse=True)

? ? return sortedFreq[:30]

def localWords(feed1, feed0):

? ? import feedparser

? ? docList=[]; classList=[]; fullText=[]

? ? minLen = min(len(feed1['entries']),len(feed0['entries']))

? ? for i in range(minLen):

? ? ? ? wordList = textParse(feed1['entries'][i]['summary'])

? ? ? ? docList.append(wordList)

? ? ? ? classList.append(1)

? ? ? ? wordList = textParse(feed0['entries'][i]['summary'])

? ? ? ? docList.append(wordList)

? ? ? ? fullText.extend(wordList)

? ? ? ? classList.append(0)

? ? vocabList = createVocabList(docList)

? ? top30Words = calcMostFreq(vocabList, fullText)

? ? for pairW in top30Words:

? ? ? ? if pairW[0] in vocabList:

? ? ? ? ? ? vocabList.remove(pairW[0])

? ? trainingSet = range(2*minLen); testSet=[]

? ? for i in range(20):

? ? ? ? randIndex = int(random.uniform(0,len(trainingSet)))

? ? ? ? testSet.append(trainingSet[randIndex])

? ? ? ? del(trainingSet[randIndex])?

? ? trainMat=[]; trainClasses=[]

? ? for docIndex in trainingSet:

? ? ? ? trainMat.append(bagOfWords2VecMN(vocabList, docList[docIndex]))

? ? ? ? trainClasses.append(classList[docIndex])

? ? p0V, p1V, pSpam = trainNB0(array(trainMat), array(trainClasses))

? ? errorCount = 0

? ? for docIndex in testSet:

? ? ? ? wordVector = bagOfWords2VecMN(vocabList, docList[docIndex])

? ? ? ? if classifyNB(array(wordVector), p0V, p1V, pSpam) != classList:

? ? ? ? ? ? errorCount += 1

? ? print('the error rate is:', float(errorCount)/len(testSet))

? ? return vocabList, p0V, p1V

import feedparser

ny=feedparser.parse('http://newyork.craigslist.org/stp/index.rss')

sf=feedparser.parse('http://sfbay.craigslist.org/stp/index.rss')

def getTopWords(ny,sf):

? ? import operator

? ? vocabList, p0V, p1V = localWords(ny, sf)

? ? topNY=[]; topSF=[]

? ? for i in range(len(p0V)):

? ? ? ? if p0V > -6.0 :topSF.append((vocabList[i], p0V[i]))

? ? ? ? if p1V > -6.0 :topNY.append((vocabList[i], p1V[i]))

? ? sortedSF = sorted(topSF, key=lambda pair: pair[i], reverse=True)

? ? print('SF**SF**SF**SF**SF**')

? ? for item in sortedSF:

? ? ? ? print(item[0])

? ? sortedNY = sorted(topNY, key=lambda pair: pair[1], reverse=True)

? ? print('NY**NY**NY**NY**NY**')

? ? for item in sortedNY:

? ? ? ? print(item[0])

getTopWords(ny, sf)

localWords(ny, sf)

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

注冊上傳代碼
轉(zhuǎn)載自：https://blog.csdn.net/Hanani_Jia/article/details/7795...
杰倫哎呦哎呦閱讀 281評論 0贊 2
別和愛的人吵架，卻對陌生人講心里話
任何時刻，你所擁有的最珍貴的東西就是此時此刻在你身邊的愛著你的家人、戀人和朋友。然而，在現(xiàn)實生活中，你往往...
柚子甜甜閱讀 518評論 0贊 2

今天凱史基金會將發(fā)布治療癌癥的臨床試驗成果
請參加zoom教學。特殊的在線直播http://KesheFoundation.org 癌癥解決方案換取和平癌...
甘斯保健正果養(yǎng)生堂閱讀 1,343評論 0贊 0
?近期熱詞：加脫西，中間派老爸，雙倍下注漢堡
剛剛過去的一周節(jié)假日，讓我們看看都有哪些新聞熱詞，以及這些熱詞背后的故事。 1.Catalexit 加泰羅尼亞脫離...
周哈哈先生閱讀 231評論 2贊 1
娶過珊彤時，劉秀是怎么想的
周末在家陪老婆刷《秀麗江山之長歌行》。秀麗嘛，自然是劉秀之秀、陰麗華之麗。看到了劉秀欲娶劉楊的外甥女過珊彤這一...
張看簡書閱讀 7,875評論 2贊 11

友情鏈接更多精彩內(nèi)容

贊1贊

贊賞

手機看全文

平定县| 叶城县| 潢川县| 库车县| 玉溪市| 宜都市| 武平县| 龙胜| 徐州市| 镇宁| 多伦县| 卢氏县| 康马县| 军事| 都安| 金平| 阿瓦提县| 杭锦后旗| 保康县| 蒙自县| 白银市| 晴隆县| 麻城市| 随州市| 阿拉善左旗| 开封县| 玉环县| 宕昌县| 津市市| 繁峙县| 腾冲县| 临安市| 左云县| 从江县| 车致| 阿拉善盟| 天台县| 乡宁县| 葵青区| 瓮安县| 新泰市|