第 0004 題:任一個英文的純文本文件,統(tǒng)計其中的單詞出現(xiàn)的個數(shù)
第 0006 題:你有一個目錄,放了你一個月的日記,都是 txt,為了避免分詞的問題,假設(shè)內(nèi)容都是英文,請統(tǒng)計出你認為每篇日記最重要的詞。
這里把最重要的詞當作出現(xiàn)頻率最高的詞來查找
答案
from collections import Counter
# 統(tǒng)計某一單詞出現(xiàn)次數(shù)
with open('find.txt', 'r') as f:
word_list = f.read().split(' ')
word = input('輸入要查找到的單詞:')
num = Counter(word_list).get(word)
if not num:
num = 0
print('{}: {}'.format(word, num))
# 統(tǒng)計日記文本中最重要的詞
with open('find.txt') as f:
word_list = f.read().split(' ')
top_word = Counter(word_list).most_common(1)[0]
print('此文本中頻率最高的詞是:{}'.format(list(top_word)[0]))