推广 热搜: 行业  机械  设备    教师    经纪  系统  参数  蒸汽 

【Python开发】年报词频统计-附完整代码

   日期:2024-11-10     移动:http://qyn41e.riyuangf.com/quote/558.html
词频统计是指统计一段文本中各个单词出现的频率。在Python中,可以使用不同的方法进行词频统计。以下是几种常见的方法:

【Python开发】年报词频统计-附完整代码

1. 原始字典自写代码统计: ```python wordcount = {} for word in all_words: wordcount[word] = wordcount.get(word, 0) + 1 sorted_wordcount = sorted(wordcount.items(), key=lambda x: x[1], reverse=True) ``` 2. 使用第三方库jieba进行中文词频统计: ```python import jieba from collections import Counter wordcount = Counter() for word in jieba.cut(text): if len(word) > 1 and word not in stop_words: wordcount[word] += 1 sorted_wordcount = wordcount.most_common(10) ``` 3. 使用原生API进行英文词频统计: ```python speech = speech_text.lower().split() wordcount = {} for word in speech: if word not in wordcount: wordcount[word] = 1 else: wordcount[word] += 1 sorted_wordcount = sorted(wordcount.items(), key=lambda x: x[1], reverse=True)[:10]
本文地址:http://g8akg8.riyuangf.com/quote/558.html    迅易网 http://g8akg8.riyuangf.com/ , 查看更多

特别提示:本信息由相关企业自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


0相关评论
相关行业动态
推荐行业动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号