python从文本文件中选出使用频率最多的单词

清华大佬耗费三个月吐血整理的几百G的资源,免费分享!....>>>

Python语言: python.从一个文本文件中选出使用频率最多的若干个单词
#coding:utf-8
# ------------------------------------------------------------
# 简介 : 从一个文件中选出使用频率最多的10个单词
#       请自行准备一个 test.txt 文档放在与本脚本相同目录
# ------------------------------------------------------------

from time import time
from operator import itemgetter

def test():
    # 取 10 个,有需要可以修改, 及定义读取的文件 test.txt 
    iList = 10
    strFileName = 'test.txt'

    count = {}
    for word in open(strFileName).read().split():
        if count.has_key(word):
            count[word] = count[word] + 1
        else:
            count[word] = 1
    print sorted(count.iteritems( ), key=itemgetter(1), reverse=True)[0:iList]

# 调用
if __name__ == '__main__':
    t1 = time()
    test()
    print time()-t1