Python 練習(xí)冊 0004、0006題 (統(tǒng)計文本)

第 0004 題:任一個英文的純文本文件,統(tǒng)計其中的單詞出現(xiàn)的個數(shù)
第 0006 題:你有一個目錄,放了你一個月的日記,都是 txt,為了避免分詞的問題,假設(shè)內(nèi)容都是英文,請統(tǒng)計出你認為每篇日記最重要的詞。

這里把最重要的詞當作出現(xiàn)頻率最高的詞來查找

答案

from collections import Counter

# 統(tǒng)計某一單詞出現(xiàn)次數(shù)
with open('find.txt', 'r') as f:
    word_list = f.read().split(' ')
    word = input('輸入要查找到的單詞:')
    num = Counter(word_list).get(word)
    if not num:
        num = 0
    print('{}: {}'.format(word, num))


# 統(tǒng)計日記文本中最重要的詞
with open('find.txt') as f:
    word_list = f.read().split(' ')
    top_word = Counter(word_list).most_common(1)[0]

    print('此文本中頻率最高的詞是:{}'.format(list(top_word)[0]))
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 剛剛學(xué)了Python一點皮毛,找東西來練手鞏固一下從知乎上看的 Python 練習(xí)冊,每天一個小程序 第 0000...
    Arudora閱讀 845評論 0 51
  • 歡迎關(guān)注我的公眾號:讀書主義 更多精彩等著你! 這個讀書方法,可能會顛覆你對讀書以往的認知|開卷 或許讀書已經(jīng)成為...
    米米粒粒閱讀 35,484評論 9 209
  • Python 練習(xí)冊,每天一個小程序,原題來自Yixiaohan/show-me-the-code我的代碼倉庫在G...
    王鵬程Orange閱讀 1,466評論 2 2
  • 常用概念: 自然語言處理(NLP) 數(shù)據(jù)挖掘 推薦算法 用戶畫像 知識圖譜 信息檢索 文本分類 常用技術(shù): 詞級別...
    御風(fēng)之星閱讀 10,042評論 1 25
  • 如夢初醒的人生。多少倉促告別,多少漠然回首,成長中的我們經(jīng)歷了多少,我們還能經(jīng)歷什么。所有的事情不需要原因就會...
    涼渡閱讀 366評論 0 0

友情鏈接更多精彩內(nèi)容