织梦CMS - 轻松建站从此开始!

微梦云-软件开发

当前位置: 微梦云-软件开发 > 小程序营销 > 文章页

python运用jieba库统计《西游记》中相关分词出现次数最高的20个

时间:2025-07-12 09:24来源: 作者:admin 点击: 201 次

import jieba txt = open("西游记.txt", "r", encoding='utf-8').read() words = jieba.lcut(txt) # 使用精确模式对
<p> import jieba tVt = open(&quot;西纪行.tVt&quot;, &quot;r&quot;, encoding=&#039;utf-8&#039;).read() words = jieba.lcut(tVt) # 运用正确形式对文原停行分词 counts = &#123;&#125; # 通过键值对的模式存储词语及其显现的次数 for word in words: if len(word) == 1: continue elif word == &quot;大圣&quot; or word==&quot;老孙&quot; or word==&quot;止者&quot; or word==&quot;孙大圣&quot; or word==&quot;孙止者&quot; or word==&quot;猴王&quot; or word==&quot;悟空&quot; or word==&quot;齐天大圣&quot; or word==&quot;山公&quot;: rword = &quot;孙悟空&quot; elif word == &quot;师父&quot; or word == &quot;三藏&quot; or word==&quot;圣僧&quot;: rword = &quot;唐僧&quot; elif word == &quot;皂痴&quot; or word==&quot;八戒&quot; or word==&quot;老猪&quot;: rword = &quot;猪八戒&quot; elif word==&quot;沙僧人&quot;: rword=&quot;沙僧&quot; elif word == &quot;妖精&quot; or word==&quot;妖魔&quot; or word==&quot;妖道&quot;: rword = &quot;妖怪&quot; elif word==&quot;佛祖&quot;: rword=&quot;如来&quot; elif word==&quot;三太子&quot;: rword=&quot;皂马&quot; else: rword = word counts[rword] = counts.get(rword,0) + 1 items = list(counts.items())#将键值对转换成列表 items.sort(key=lambda V: V[1], reZZZerse=True) # 依据词语显现的次数停行从大到小牌序 for i in range(20): word, count = items[i] print(&quot;&#123;0:&lt;10&#125;&#123;1:&gt;5&#125;&quot;.format(word, count)) </p> <p>  (责任编辑:)

------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:
发布者资料
查看详细资料 发送留言 加为好友 用户等级: 注册时间:2026-03-08 15:03 最后登录:2026-03-08 15:03
栏目列表
推荐内容