红楼梦是中国古典小说的代表作之一,其中充满着生动的描写和精美的词汇,因此对于语言处理的爱好者来说,对红楼梦的词频统计也是一个有趣的任务。使用Python可以轻松完成这个任务,下面是一个简单的红楼梦词频统计Python代码:```Pythonimport jiebafrom collections import Counter#读取红楼梦文本文件with open('hongloumeng.txt', 'r', encoding='utf-8') as f:text = f.read()#使用jieba分词words = jieba.cut(text)#统计词频counter = Counter(words)#打印出出现频率最高的前十个词for word, cnt in counter.most_common(10):print(word, cnt)```上述代码使用了jieba库对红楼梦文本进行分词,然后使用collections.Counter类对分词结果进行词频统计。最后,打印出出现频率最高的前十个词,可以方便地得出红楼梦中的关键词汇。需要注意的是,在运行代码前,需要将红楼梦文本文件hongloumeng.txt放在同一目录下。
python之红楼梦词频统计并生成图云
python之红楼梦词频统计并生成图云文章浏览阅读6.4k次,点赞7次,收藏72次。一共三个文件Hlm.pystop_words.txt红楼梦.txt(tips: txt文件已放在文章最后)废话不多说
发表评论