Python基于wordcloud及jieba实现中国地图词云图


Posted in Python onJune 09, 2020

热词图很酷炫,也非常适合热点事件,抓住重点,以图文结合的方式表现出来,很有冲击力。下面这段代码是制作热词图的,用到了以下技术:

jieba,把文本分词

wordcloud,制作热图

chardet,辨别文件的编码格式,其中中文统一为GB18030,更加的兼容

imageio,提取图片的形状

其他:自动识别文件编码,自动识别txt文件,图片文件名与txt文件一致,使用的是四大名著的文本(自行百度),部分中国地图

上代码:

import os
import jieba
import wordcloud
import chardet
import imageio
 
directory = "D:\\"
mask = imageio.imread(r"D:\map.jpg") # 用于最后图像图形
 
directory_lists = os.scandir(directory)
for directory_list in directory_lists:
 
  if directory_list.is_dir() or directory_list.path.split('.')[-1] != "txt":
    continue
 
  with open(directory_list.path, 'rb') as fd:
    coding = chardet.detect(fd.read()[:1000])['encoding']
    if coding.upper() == 'GB2312' or coding == 'GBK':
      coding = 'GB18030'
  file = open(directory_list.path, 'r', encoding=coding)
  text = file.read()
  file.close()
  jieba_text = ' '.join(jieba.lcut(text))
 
  w = wordcloud.WordCloud(height=800, width=1600, font_path='msyh.ttc', background_color='white', stopwords={'Page'}, mask=mask)
  w.generate(jieba_text)
  w.to_file('{}.png'.format(directory_list.path.split('.')[0]))

输出:

水浒传的如下

Python基于wordcloud及jieba实现中国地图词云图

西游记的如下

Python基于wordcloud及jieba实现中国地图词云图

仔细看输出的内容,还是挺有意思的,哈哈哈。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用python实现扫描端口示例
Mar 29 Python
全面理解Python中self的用法
Jun 04 Python
Python多进程multiprocessing用法实例分析
Aug 18 Python
python pandas 对series和dataframe的重置索引reindex方法
Jun 07 Python
Python 创建新文件时避免覆盖已有的同名文件的解决方法
Nov 16 Python
django session完成状态保持的方法
Nov 27 Python
对Python 简单串口收发GUI界面的实例详解
Jun 12 Python
tensorflow 实现自定义layer并添加到计算图中
Feb 04 Python
解决pycharm不能自动保存在远程linux中的问题
Feb 06 Python
Python中的流程控制详解
Feb 18 Python
Python绘制数码晶体管日期
Feb 19 Python
Pygame Time时间控制的具体使用详解
Nov 17 Python
Python中的__init__作用是什么
Jun 09 #Python
python小白学习包管理器pip安装
Jun 09 #Python
Python小白垃圾回收机制入门
Jun 09 #Python
Python中如何添加自定义模块
Jun 09 #Python
sklearn线性逻辑回归和非线性逻辑回归的实现
Jun 09 #Python
Python如何避免文件同名产生覆盖
Jun 09 #Python
对Keras中predict()方法和predict_classes()方法的区别说明
Jun 09 #Python
You might like
人族 Terran 魔法与科技
2020/03/14 星际争霸
使用TinyButStrong模板引擎来做WEB开发
2007/03/16 PHP
PHP学习笔记之字符串编码的转换和判断
2014/05/22 PHP
基于laravel where的高级使用方法
2019/10/10 PHP
用正则xmlHttp实现的偷(转)
2007/01/22 Javascript
疯掉了,尽然有js写的操作系统
2007/04/23 Javascript
JQuery的ajax获取数据后的处理总结(html,xml,json)
2010/07/14 Javascript
jquery解析XML字符串和XML文件的方法说明
2014/02/21 Javascript
ExtJS4利根据登录后不同的角色分配不同的树形菜单
2014/05/02 Javascript
jQuery+ajax实现鼠标单击修改内容的思路
2014/06/29 Javascript
javascript实现倒计时N秒后网页自动跳转代码
2014/12/11 Javascript
做web开发 先学JavaScript
2014/12/12 Javascript
使用jquery+CSS实现控制打印样式
2014/12/31 Javascript
AngularJS基础学习笔记之控制器
2015/05/10 Javascript
JavaScript实现的简单烟花特效代码
2015/10/20 Javascript
jquery实现超简单的瀑布流布局【推荐】
2017/03/08 Javascript
JavaScript字符串转数字的5种方法及遇到的坑
2018/07/16 Javascript
Vue.js的动态组件模板的实现
2018/11/26 Javascript
javascript使用canvas实现饼状图效果
2020/09/08 Javascript
[58:00]DOTA2-DPC中国联赛 正赛 PSG.LGD vs Elephant BO3 第二场 2月7日
2021/03/11 DOTA
Python实现Windows上气泡提醒效果的方法
2015/06/03 Python
python学习之编写查询ip程序
2016/02/27 Python
centos6.4下python3.6.1安装教程
2017/07/21 Python
Python中支持向量机SVM的使用方法详解
2017/12/26 Python
python引入不同文件夹下的自定义模块方法
2018/10/27 Python
新年快乐! python实现绚烂的烟花绽放效果
2019/01/30 Python
如何利用python读取micaps文件详解
2020/10/18 Python
Python中Qslider控件实操详解
2021/02/20 Python
自主招生教师推荐信
2014/05/10 职场文书
安全施工标语
2014/06/07 职场文书
2014年领导班子专项整治整改方案
2014/09/28 职场文书
2014年公路养护工作总结
2014/12/04 职场文书
团员年度个人总结
2015/02/26 职场文书
幼儿园家长反馈意见
2015/06/03 职场文书
幼儿园科学课教学反思
2016/03/03 职场文书
祝福语集锦:送给毕业同学祝福语
2019/11/21 职场文书