利用Python抓取行政区划码的方法


Posted in Python onNovember 28, 2016

前言

国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。

注意:抓取下来以后还要进行简单的人工的整理

示例代码:

# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
 get_xzqh()

注意事项:

另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:\Program Files\Tencent\QQ\I18N\2052

如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的,极易导入数据库。

总结

以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。

Python 相关文章推荐
可用于监控 mysql Master Slave 状态的python代码
Feb 10 Python
python执行shell获取硬件参数写入mysql的方法
Dec 29 Python
Python中分数的相关使用教程
Mar 30 Python
python 环境变量和import模块导入方法(详解)
Jul 11 Python
PyQt5实现简易电子词典
Jun 25 Python
python 扩展print打印文件路径和当前时间信息的实例代码
Oct 11 Python
Flask框架路由和视图用法实例分析
Nov 07 Python
Django实现将一个字典传到前端显示出来
Apr 03 Python
Python-jenkins模块获取jobs的执行状态操作
May 12 Python
python如何进行基准测试
Apr 26 Python
关于python pygame游戏进行声音添加的技巧
Oct 24 Python
pytorch中的torch.nn.Conv2d()函数图文详解
Feb 28 Python
Python抓取手机号归属地信息示例代码
Nov 28 #Python
Python文本相似性计算之编辑距离详解
Nov 28 #Python
Python实现全角半角字符互转的方法
Nov 28 #Python
Python连接PostgreSQL数据库的方法
Nov 28 #Python
windows及linux环境下永久修改pip镜像源的方法
Nov 28 #Python
Python如何为图片添加水印
Nov 25 #Python
Python pass详细介绍及实例代码
Nov 24 #Python
You might like
通过对php一些服务器端特性的配置加强php的安全
2006/10/09 PHP
PHP 截取字符串专题集合
2010/08/19 PHP
php 生成短网址原理及代码
2014/01/23 PHP
浅谈PHP接收POST数据方式
2015/06/05 PHP
php+resumablejs实现的分块上传 断点续传功能示例
2017/04/18 PHP
轻轻松松学JS调试(不下载任何工具)
2010/04/14 Javascript
JavaScript中的this关键字介绍与使用实例
2013/06/21 Javascript
JavaScript DOM节点添加示例
2014/07/16 Javascript
JavaScript获取网页支持表单字符集的方法
2015/04/02 Javascript
jQuery实现下拉加载功能实例代码
2016/04/01 Javascript
微信公众号 摇一摇周边功能开发
2016/12/08 Javascript
JavaScript箭头函数_动力节点Java学院整理
2017/06/28 Javascript
解析Vue 2.5的Diff算法
2017/11/28 Javascript
详解AngularJS 过滤器的使用
2018/06/02 Javascript
react.js组件实现拖拽复制和可排序的示例代码
2018/08/20 Javascript
用原生JS实现爱奇艺首页导航栏代码实例
2019/09/19 Javascript
原理深度解析Vue的响应式更新比React快
2020/04/04 Javascript
vue循环中点击选中再点击取消(单选)的实现
2020/09/10 Javascript
JS实现鼠标移动拖尾
2020/12/27 Javascript
Python自动重试HTTP连接装饰器
2015/04/28 Python
Python合并多个Excel数据的方法
2018/07/16 Python
Python跳出多重循环的方法示例
2019/07/03 Python
详解Python是如何实现issubclass的
2019/07/24 Python
Tensorflow: 从checkpoint文件中读取tensor方式
2020/02/10 Python
Python使用monkey.patch_all()解决协程阻塞问题
2020/04/15 Python
Anaconda+vscode+pytorch环境搭建过程详解
2020/05/25 Python
Python批量获取并保存手机号归属地和运营商的示例
2020/10/09 Python
Python QT组件库qtwidgets的使用
2020/11/02 Python
基于Python实现粒子滤波效果
2020/12/01 Python
母亲节演讲稿范文
2014/01/02 职场文书
双十佳事迹材料
2014/01/29 职场文书
前台文员职责范本
2014/03/07 职场文书
2015年护士工作总结范文
2015/03/31 职场文书
2015年医务科工作总结范文
2015/05/26 职场文书
运动员加油词
2015/07/18 职场文书
职场新人知识:如何制定一份合理的工作计划?
2019/09/11 职场文书