Python基于wordcloud及jieba实现中国地图词云图


Posted in Python onJune 09, 2020

热词图很酷炫,也非常适合热点事件,抓住重点,以图文结合的方式表现出来,很有冲击力。下面这段代码是制作热词图的,用到了以下技术:

jieba,把文本分词

wordcloud,制作热图

chardet,辨别文件的编码格式,其中中文统一为GB18030,更加的兼容

imageio,提取图片的形状

其他:自动识别文件编码,自动识别txt文件,图片文件名与txt文件一致,使用的是四大名著的文本(自行百度),部分中国地图

上代码:

import os
import jieba
import wordcloud
import chardet
import imageio
 
directory = "D:\\"
mask = imageio.imread(r"D:\map.jpg") # 用于最后图像图形
 
directory_lists = os.scandir(directory)
for directory_list in directory_lists:
 
  if directory_list.is_dir() or directory_list.path.split('.')[-1] != "txt":
    continue
 
  with open(directory_list.path, 'rb') as fd:
    coding = chardet.detect(fd.read()[:1000])['encoding']
    if coding.upper() == 'GB2312' or coding == 'GBK':
      coding = 'GB18030'
  file = open(directory_list.path, 'r', encoding=coding)
  text = file.read()
  file.close()
  jieba_text = ' '.join(jieba.lcut(text))
 
  w = wordcloud.WordCloud(height=800, width=1600, font_path='msyh.ttc', background_color='white', stopwords={'Page'}, mask=mask)
  w.generate(jieba_text)
  w.to_file('{}.png'.format(directory_list.path.split('.')[0]))

输出:

水浒传的如下

Python基于wordcloud及jieba实现中国地图词云图

西游记的如下

Python基于wordcloud及jieba实现中国地图词云图

仔细看输出的内容,还是挺有意思的,哈哈哈。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python删除windows垃圾文件的方法
Jul 14 Python
python类的继承实例详解
Mar 30 Python
python 遍历字符串(含汉字)实例详解
Apr 04 Python
Python网络编程使用select实现socket全双工异步通信功能示例
Apr 09 Python
python实现海螺图片的方法示例
May 12 Python
详解python运行三种方式
May 13 Python
python numpy实现文件存取的示例代码
May 26 Python
基于Python的Post请求数据爬取的方法详解
Jun 14 Python
Jmeter HTTPS接口测试证书导入过程图解
Jul 22 Python
python 从list中随机取值的方法
Nov 16 Python
Python中json.load()和json.loads()有哪些区别
Jun 07 Python
Python合并pdf文件的工具
Jul 01 Python
Python中的__init__作用是什么
Jun 09 #Python
python小白学习包管理器pip安装
Jun 09 #Python
Python小白垃圾回收机制入门
Jun 09 #Python
Python中如何添加自定义模块
Jun 09 #Python
sklearn线性逻辑回归和非线性逻辑回归的实现
Jun 09 #Python
Python如何避免文件同名产生覆盖
Jun 09 #Python
对Keras中predict()方法和predict_classes()方法的区别说明
Jun 09 #Python
You might like
php中base64_decode与base64_encode加密解密函数实例
2014/11/24 PHP
PHP+Ajax实时自动检测是否联网的方法
2015/07/01 PHP
YII CLinkPager分页类扩展增加显示共多少页
2016/01/29 PHP
PHP Smarty模版简单使用方法
2016/03/30 PHP
php基于 swoole 实现的异步处理任务功能示例
2019/08/13 PHP
使用PHP+Redis实现延迟任务,实现自动取消订单功能
2019/11/21 PHP
浅析JavaScript中的常用算法与函数
2013/11/21 Javascript
jquery数组封装使用方法分享(jquery数组遍历)
2014/03/25 Javascript
JavaScript获取table中某一列的值的方法
2014/05/06 Javascript
jQuery操作元素css样式的三种方法
2014/06/04 Javascript
JavaScript中的Math.SQRT1_2属性使用简介
2015/06/14 Javascript
使用Node.js实现HTTP 206内容分片的教程
2015/06/23 Javascript
js仿支付宝填写支付密码效果实现多方框输入密码
2016/03/09 Javascript
一个例子轻松学会Vue.js
2017/01/02 Javascript
JavaScript输入分钟、秒倒计时技巧总结(附代码)
2017/08/17 Javascript
react-router v4如何使用history控制路由跳转详解
2018/01/09 Javascript
小程序云开发教程如何使用云函数实现点赞功能
2019/05/18 Javascript
[44:09]DOTA2上海特级锦标赛A组小组赛#1 EHOME VS MVP.Phx第二局
2016/02/25 DOTA
利用Python的Django框架中的ORM建立查询API
2015/04/20 Python
Python爬虫实例_城市公交网络站点数据的爬取方法
2018/01/10 Python
python图形开发GUI库wxpython使用方法详解
2020/02/14 Python
Pytorch 解决自定义子Module .cuda() tensor失败的问题
2020/06/23 Python
python在linux环境下安装skimage的示例代码
2020/10/14 Python
详解pandas赋值失败问题解决
2020/11/29 Python
瑞士国际航空官网:SWISS
2016/07/21 全球购物
John Varvatos官方网站:设计师男士时装
2017/02/08 全球购物
Boden澳大利亚官网:英国在线服装公司
2018/08/05 全球购物
美国儿童珠宝在线零售商:Loveivy
2019/05/22 全球购物
电子商务专业实习生自我鉴定
2013/09/24 职场文书
宠物店的创业计划书范文
2014/01/11 职场文书
英语演讲稿3分钟
2014/04/29 职场文书
社区党员群众路线教育实践活动心得体会
2014/11/03 职场文书
开工典礼致辞
2015/07/29 职场文书
Python Django 后台管理之后台模型属性详解
2021/04/25 Python
为什么node.js不适合大型项目
2021/04/28 Javascript
Oracle用户管理及赋权
2022/04/24 Oracle