利用Python抓取行政区划码的方法


Posted in Python onNovember 28, 2016

前言

国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。

注意:抓取下来以后还要进行简单的人工的整理

示例代码:

# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
 get_xzqh()

注意事项:

另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:\Program Files\Tencent\QQ\I18N\2052

如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的,极易导入数据库。

总结

以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。

Python 相关文章推荐
python在linux系统下获取系统内存使用情况的方法
May 11 Python
详细解析Python中__init__()方法的高级应用
May 11 Python
Python加密方法小结【md5,base64,sha1】
Jul 13 Python
windows下python之mysqldb模块安装方法
Sep 07 Python
解决出现Incorrect integer value: '' for column 'id' at row 1的问题
Oct 29 Python
100行Python代码实现自动抢火车票(附源码)
Jan 11 Python
Python SQLite3简介
Feb 22 Python
解决pyqt5中QToolButton无法使用的问题
Jun 21 Python
Python 调用 Windows API COM 新法
Aug 22 Python
Matplotlib中%matplotlib inline如何使用
Jul 28 Python
详解vscode实现远程linux服务器上Python开发
Nov 10 Python
Python3.10的一些新特性原理分析
Sep 15 Python
Python抓取手机号归属地信息示例代码
Nov 28 #Python
Python文本相似性计算之编辑距离详解
Nov 28 #Python
Python实现全角半角字符互转的方法
Nov 28 #Python
Python连接PostgreSQL数据库的方法
Nov 28 #Python
windows及linux环境下永久修改pip镜像源的方法
Nov 28 #Python
Python如何为图片添加水印
Nov 25 #Python
Python pass详细介绍及实例代码
Nov 24 #Python
You might like
PHP运行SVN命令显示某用户的文件更新记录的代码
2014/01/03 PHP
PHP编译安装中遇到的两个错误和解决方法
2014/08/20 PHP
PHP生成制作验证码的简单实例
2016/06/12 PHP
PHP 数组基本操作方法详解
2016/06/17 PHP
PHP 根据key 给二维数组分组
2016/12/09 PHP
PHP实现表单提交时去除斜杠的方法
2016/12/26 PHP
Laravel如何友好的修改.env配置文件详解
2017/06/07 PHP
PHP共享内存使用与信号控制实例分析
2018/05/09 PHP
Js获取数组最大和最小值示例代码
2013/10/29 Javascript
js 限制input只能输入数字、字母和汉字等等
2013/12/18 Javascript
JavaScript合并两个数组并去除重复项的方法
2015/06/13 Javascript
JavaScript禁止用户多次提交的两种方法
2016/07/24 Javascript
Bootstrap实现渐变顶部固定自适应导航栏
2020/08/27 Javascript
详解JS中的attribute属性
2017/04/25 Javascript
vue2.0中click点击当前li实现动态切换class
2017/06/21 Javascript
JavaScript字符串检索字符的方法
2017/06/23 Javascript
node koa2实现上传图片并且同步上传到七牛云存储
2017/07/31 Javascript
JavaScript实现离开页面前提示功能【附jQuery实现方法】
2017/09/26 jQuery
总结JavaScript在IE9之前版本中内存泄露问题
2018/04/28 Javascript
Vue触发式全局组件构建的方法
2018/11/28 Javascript
python感知机实现代码
2019/01/18 Python
使用虚拟环境打包python为exe 文件的方法
2019/08/29 Python
在PyTorch中使用标签平滑正则化的问题
2020/04/03 Python
python 如何区分return和yield
2020/09/22 Python
python输出国际象棋棋盘的实例分享
2020/11/26 Python
python用700行代码实现http客户端
2021/01/14 Python
详解HTML5通讯录获取指定多个人的信息
2016/12/20 HTML / CSS
解析HTML5中的新功能本地存储localStorage
2016/03/01 HTML / CSS
HTML5 实现图片上传预处理功能
2020/02/06 HTML / CSS
Lookfantastic意大利官网:英国知名美妆购物网站
2019/05/31 全球购物
山海经纬软件测试笔试题和面试题
2013/04/02 面试题
医德医魂心得体会
2014/09/11 职场文书
课外活动实习计划
2015/01/19 职场文书
2015年校本培训工作总结
2015/07/24 职场文书
Python超详细分步解析随机漫步
2022/03/17 Python
python manim实现排序算法动画示例
2022/08/14 Python