##详细说明:
“词云”就是数据可视化的一种形式,给出一段文本,根据文本中词语的出现频率而生成的一幅图像,从而过滤掉大量的文本信息,人们只要扫一眼就能够明白文章主旨,使得数据分析的结果更加直观。
##准备工作: 1.安装必要的第三方库:
pip install wordcloud
pip install jieba
pip install numpy
pip install wxPython
需要注意一点,因为wordcloud自带的字体文件不支持中文,为了让wordcloud支持中文词云的生成,安装完wordcloud库后需要hack一下,具体做法如下: 复制一个中文字体文件(在本项目中为方正姚体 FZYTK.TTF)到wordcloud安装路径下(如:C:Python27Libsite-packageswordcloud),然后打开wordcloud库中的wordcloud.py文档,将其中的 "FONT_PATH = os.environ.get('FONT_PATH', os.path.join(FILE, 'DroidSansMono.ttf'))" (本项目的附件中将附带 FZYTK.TTF 字体文件)
改写为 "FONT_PATH = os.environ.get('FONT_PATH', os.path.join(FILE, 'FZYTK.TTF'))".
这样wordcloud将会以"FZYTK.TTF"作为字体文件.
##项目结构: 整体的项目结构十分简单,一共三个脚本文件,一个是GUI界面脚本(draw_gui.py), 一个是GUI菜单的辅助性脚本(utility_template.py), 一个是词云生成器脚本(wordcloud_gen.py)。 如下:
##程序实现 以下是程序的实现思路,以及步骤,实现步骤里,附上了关键代码,全部的代码,请下载代码后阅读
在wordcloud_gen.py中导入相关的库:
from os import path
from PIL import Image
import numpy as np
import time