Python基于wordcloud及jieba实现中国地图词云图


Posted in Python onJune 09, 2020

热词图很酷炫,也非常适合热点事件,抓住重点,以图文结合的方式表现出来,很有冲击力。下面这段代码是制作热词图的,用到了以下技术:

jieba,把文本分词

wordcloud,制作热图

chardet,辨别文件的编码格式,其中中文统一为GB18030,更加的兼容

imageio,提取图片的形状

其他:自动识别文件编码,自动识别txt文件,图片文件名与txt文件一致,使用的是四大名著的文本(自行百度),部分中国地图

上代码:

import os
import jieba
import wordcloud
import chardet
import imageio
 
directory = "D:\\"
mask = imageio.imread(r"D:\map.jpg") # 用于最后图像图形
 
directory_lists = os.scandir(directory)
for directory_list in directory_lists:
 
  if directory_list.is_dir() or directory_list.path.split('.')[-1] != "txt":
    continue
 
  with open(directory_list.path, 'rb') as fd:
    coding = chardet.detect(fd.read()[:1000])['encoding']
    if coding.upper() == 'GB2312' or coding == 'GBK':
      coding = 'GB18030'
  file = open(directory_list.path, 'r', encoding=coding)
  text = file.read()
  file.close()
  jieba_text = ' '.join(jieba.lcut(text))
 
  w = wordcloud.WordCloud(height=800, width=1600, font_path='msyh.ttc', background_color='white', stopwords={'Page'}, mask=mask)
  w.generate(jieba_text)
  w.to_file('{}.png'.format(directory_list.path.split('.')[0]))

输出:

水浒传的如下

Python基于wordcloud及jieba实现中国地图词云图

西游记的如下

Python基于wordcloud及jieba实现中国地图词云图

仔细看输出的内容,还是挺有意思的,哈哈哈。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现超简单端口转发的方法
Mar 13 Python
Python爬虫框架Scrapy实战之批量抓取招聘信息
Aug 07 Python
Python中遇到的小问题及解决方法汇总
Jan 11 Python
PyQt5利用QPainter绘制各种图形的实例
Oct 19 Python
LRUCache的实现原理及利用python实现的方法
Nov 21 Python
Python常见MongoDB数据库操作实例总结
Jul 24 Python
numpy实现神经网络反向传播算法的步骤
Dec 24 Python
python异常处理、自定义异常、断言原理与用法分析
Mar 23 Python
利用python如何实现猫捉老鼠小游戏
Dec 04 Python
如何在vscode中安装python库的方法步骤
Jan 06 Python
2020年10款优秀的Python第三方库,看看有你中意的吗?
Jan 12 Python
解决Pytorch dataloader时报错每个tensor维度不一样的问题
May 28 Python
Python中的__init__作用是什么
Jun 09 #Python
python小白学习包管理器pip安装
Jun 09 #Python
Python小白垃圾回收机制入门
Jun 09 #Python
Python中如何添加自定义模块
Jun 09 #Python
sklearn线性逻辑回归和非线性逻辑回归的实现
Jun 09 #Python
Python如何避免文件同名产生覆盖
Jun 09 #Python
对Keras中predict()方法和predict_classes()方法的区别说明
Jun 09 #Python
You might like
php 获取客户端的真实ip
2009/11/30 PHP
php设计模式 FlyWeight (享元模式)
2011/06/26 PHP
PHP人民币金额数字转中文大写的函数代码
2013/02/27 PHP
iOS+PHP注册登录系统 PHP部分(上)
2016/12/26 PHP
Yii CFileCache 获取不到值的原因分析
2017/02/08 PHP
给jqGrid数据行添加修改和删除操作链接(之一)
2011/11/04 Javascript
全面兼容的javascript时间格式化函数(比较实用)
2014/05/14 Javascript
jQuery实现点击后标记当前菜单位置(背景高亮菜单)效果
2015/08/22 Javascript
js实现向右横向滑出的二级菜单效果
2015/08/27 Javascript
javascript每日必学之循环
2016/02/19 Javascript
关于JS中的apply,call,bind的深入解析
2016/04/05 Javascript
实现JavaScript的组成----BOM和DOM详解
2016/05/18 Javascript
JavaScript实现简单的拖动效果
2016/07/02 Javascript
node.js实现博客小爬虫的实例代码
2016/10/08 Javascript
jQuery中delegate()方法的用法详解
2016/10/13 Javascript
浅谈MVC+EF easyui dataGrid 动态加载分页表格
2016/11/10 Javascript
JavaScript 计算笛卡尔积实例详解
2016/12/02 Javascript
原生JS实现导航下拉菜单效果
2020/11/25 Javascript
Rollup处理并打包JS文件项目实例代码
2018/05/31 Javascript
VueX模块的具体使用(小白教程)
2020/06/05 Javascript
JavaScript动态生成表格的示例
2020/11/02 Javascript
Python制作爬虫采集小说
2015/10/25 Python
Pandas标记删除重复记录的方法
2018/04/08 Python
python库lxml在linux和WIN系统下的安装
2018/06/24 Python
python程序控制NAO机器人行走
2019/04/29 Python
使用Python正则表达式操作文本数据的方法
2019/05/14 Python
django 捕获异常和日志系统过程详解
2019/07/18 Python
ubuntu16.04升级Python3.5到Python3.7的方法步骤
2020/08/20 Python
举例讲解Python装饰器
2020/12/24 Python
详解CSS3的perspective属性设置3D变换距离的方法
2016/05/23 HTML / CSS
iHerb台湾:维生素、保健品和健康产品
2018/01/31 全球购物
潘多拉珠宝俄罗斯官方网上商店:PANDORA俄罗斯
2020/09/22 全球购物
幼儿园校车安全责任书
2015/05/08 职场文书
2016公司中秋节寄语
2015/12/07 职场文书
初中政治教师教学反思
2016/02/23 职场文书
Java 将PPT幻灯片转为HTML文件的实现思路
2021/06/11 Java/Android