Python基于wordcloud及jieba实现中国地图词云图


Posted in Python onJune 09, 2020

热词图很酷炫,也非常适合热点事件,抓住重点,以图文结合的方式表现出来,很有冲击力。下面这段代码是制作热词图的,用到了以下技术:

jieba,把文本分词

wordcloud,制作热图

chardet,辨别文件的编码格式,其中中文统一为GB18030,更加的兼容

imageio,提取图片的形状

其他:自动识别文件编码,自动识别txt文件,图片文件名与txt文件一致,使用的是四大名著的文本(自行百度),部分中国地图

上代码:

import os
import jieba
import wordcloud
import chardet
import imageio
 
directory = "D:\\"
mask = imageio.imread(r"D:\map.jpg") # 用于最后图像图形
 
directory_lists = os.scandir(directory)
for directory_list in directory_lists:
 
  if directory_list.is_dir() or directory_list.path.split('.')[-1] != "txt":
    continue
 
  with open(directory_list.path, 'rb') as fd:
    coding = chardet.detect(fd.read()[:1000])['encoding']
    if coding.upper() == 'GB2312' or coding == 'GBK':
      coding = 'GB18030'
  file = open(directory_list.path, 'r', encoding=coding)
  text = file.read()
  file.close()
  jieba_text = ' '.join(jieba.lcut(text))
 
  w = wordcloud.WordCloud(height=800, width=1600, font_path='msyh.ttc', background_color='white', stopwords={'Page'}, mask=mask)
  w.generate(jieba_text)
  w.to_file('{}.png'.format(directory_list.path.split('.')[0]))

输出:

水浒传的如下

Python基于wordcloud及jieba实现中国地图词云图

西游记的如下

Python基于wordcloud及jieba实现中国地图词云图

仔细看输出的内容,还是挺有意思的,哈哈哈。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的列表知识点汇总
Apr 14 Python
Python编程中运用闭包时所需要注意的一些地方
May 02 Python
对python中的xlsxwriter库简单分析
May 04 Python
Python实现求解一元二次方程的方法示例
Jun 20 Python
Python Pandas批量读取csv文件到dataframe的方法
Oct 08 Python
浅谈解除装饰器作用(python3新增)
Oct 15 Python
Scrapy框架爬取西刺代理网免费高匿代理的实现代码
Feb 22 Python
python实现名片管理系统项目
Apr 26 Python
python自动化测试之如何解析excel文件
Jun 27 Python
python使用tomorrow实现多线程的例子
Jul 20 Python
django将数组传递给前台模板的方法
Aug 06 Python
python中 .npy文件的读写操作实例
Apr 14 Python
Python中的__init__作用是什么
Jun 09 #Python
python小白学习包管理器pip安装
Jun 09 #Python
Python小白垃圾回收机制入门
Jun 09 #Python
Python中如何添加自定义模块
Jun 09 #Python
sklearn线性逻辑回归和非线性逻辑回归的实现
Jun 09 #Python
Python如何避免文件同名产生覆盖
Jun 09 #Python
对Keras中predict()方法和predict_classes()方法的区别说明
Jun 09 #Python
You might like
PHP session有效期session.gc_maxlifetime
2011/04/20 PHP
使用PHP获取当前url路径的函数以及服务器变量
2013/06/29 PHP
php常用的安全过滤函数集锦
2014/10/09 PHP
PHP扩展模块memcached长连接使用方法分析
2014/12/24 PHP
PHP实现获取并生成数据库字典的方法
2016/05/04 PHP
php用户密码加密算法分析【Discuz加密算法】
2016/10/12 PHP
一些易混淆且不常用的属性,希望有用
2007/01/29 Javascript
Extjs学习笔记之五 一个小细节renderTo和applyTo的区别
2010/01/07 Javascript
javascript之querySelector和querySelectorAll使用说明
2011/10/09 Javascript
js jquery获取当前元素的兄弟级 上一个 下一个元素
2015/09/01 Javascript
使用jQuery mobile库检测url绝对地址和相对地址的方法
2015/12/04 Javascript
通过Tabs方法基于easyUI+bootstrap制作工作站
2016/03/28 Javascript
详解axios在vue中的简单配置与使用
2017/05/10 Javascript
JavaScript实现图片无缝滚动效果
2017/07/07 Javascript
JavaScript中AOP的实现与应用
2019/05/06 Javascript
使用Vue-Awesome-Swiper实现旋转叠加轮播效果&平移轮播效果
2019/08/16 Javascript
python list 合并连接字符串的方法
2013/03/09 Python
解析Python编程中的包结构
2015/10/25 Python
python+Django+apache的配置方法详解
2016/06/01 Python
详解python中的json的基本使用方法
2016/12/21 Python
django实现用户登陆功能详解
2017/12/11 Python
Python分支结构(switch)操作简介
2018/01/17 Python
PythonWeb项目Django部署在Ubuntu18.04腾讯云主机上
2019/04/01 Python
Python面向对象程序设计之静态方法、类方法、属性方法原理与用法分析
2020/03/23 Python
英国创新设计文具、卡片和礼品包装网站:Paperchase
2018/07/14 全球购物
Shein英国:女性时尚网上商店
2019/04/10 全球购物
MYSQL基础面试题
2012/05/13 面试题
管理站站长岗位职责
2013/11/27 职场文书
八项规定自查自纠报告及整改措施
2014/10/26 职场文书
2014年仓管员工作总结
2014/11/18 职场文书
2014年医院后勤工作总结
2014/12/06 职场文书
网站文案策划岗位职责
2015/04/14 职场文书
医德医风学习心得体会
2016/01/25 职场文书
创业计划书之网吧
2019/10/10 职场文书
TV动画「神渣☆爱豆」公开第一弹主视觉图
2022/03/21 日漫
使用HBuilder制作一个简单的HTML5网页
2022/07/07 HTML / CSS