利用Python抓取行政区划码的方法


Posted in Python onNovember 28, 2016

前言

国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。

注意:抓取下来以后还要进行简单的人工的整理

示例代码:

# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
 get_xzqh()

注意事项:

另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:\Program Files\Tencent\QQ\I18N\2052

如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的,极易导入数据库。

总结

以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。

Python 相关文章推荐
Python实现的一个简单LRU cache
Sep 26 Python
Python的shutil模块中文件的复制操作函数详解
Jul 05 Python
Linux下为不同版本python安装第三方库
Aug 31 Python
python开发环境PyScripter中文乱码问题解决方案
Sep 11 Python
python 利用栈和队列模拟递归的过程
May 29 Python
Python变量类型知识点总结
Feb 18 Python
Python学习笔记之pandas索引列、过滤、分组、求和功能示例
Jun 03 Python
python使用百度文字识别功能方法详解
Jul 23 Python
python使用SQLAlchemy操作MySQL
Jan 02 Python
django从后台返回html代码的实例
Mar 11 Python
python中pyplot基础图标函数整理
Nov 10 Python
使用tkinter实现三子棋游戏
Feb 25 Python
Python抓取手机号归属地信息示例代码
Nov 28 #Python
Python文本相似性计算之编辑距离详解
Nov 28 #Python
Python实现全角半角字符互转的方法
Nov 28 #Python
Python连接PostgreSQL数据库的方法
Nov 28 #Python
windows及linux环境下永久修改pip镜像源的方法
Nov 28 #Python
Python如何为图片添加水印
Nov 25 #Python
Python pass详细介绍及实例代码
Nov 24 #Python
You might like
php设计模式 Chain Of Responsibility (职责链模式)
2011/06/26 PHP
基于php冒泡排序算法的深入理解
2013/06/09 PHP
解析PHP中VC6 X86和VC9 X86的区别及 Non Thread Safe的意思
2013/06/28 PHP
WordPress网站性能优化指南
2015/11/18 PHP
基于jquery的finkyUI插件与Ajax实现页面数据加载功能
2010/12/03 Javascript
Jquery右下角抖动、浮动 实例代码(兼容ie6、FF)
2013/08/15 Javascript
jquery与js函数冲突的两种解决方法
2013/09/09 Javascript
jquery等待效果示例
2014/05/01 Javascript
判断复选框是否被选中的两种方法
2014/06/04 Javascript
JS实现的3D拖拽翻页效果代码
2015/10/31 Javascript
JS实现的论坛Ajax打分效果完整实例
2015/10/31 Javascript
基于jQuery实现Ajax验证用户名是否存在实例
2016/03/30 Javascript
JS实用技巧小结(屏蔽错误、div滚动条设置、背景图片位置等)
2016/06/16 Javascript
详解Javascript数据类型的转换规则
2016/12/12 Javascript
微信小程序 设置启动页面的两种方法
2017/03/09 Javascript
JavaScript对JSON数据进行排序和搜索
2017/07/24 Javascript
vue仿淘宝订单状态的tab切换效果
2020/06/23 Javascript
vue2.0 elementUI制作面包屑导航栏
2018/02/22 Javascript
Angular服务Request异步请求的实例讲解
2018/08/13 Javascript
vue中的ref和$refs的使用
2018/11/22 Javascript
详解关于Angular4 ng-zorro使用过程中遇到的问题
2018/12/05 Javascript
python的re模块应用实例
2014/09/26 Python
仅用500行Python代码实现一个英文解析器的教程
2015/04/02 Python
深度定制Python的Flask框架开发环境的一些技巧总结
2016/07/12 Python
OpenCV2.3.1+Python2.7.3+Numpy等的配置解析
2018/01/05 Python
Python生成任意范围任意精度的随机数方法
2018/04/09 Python
python3+PyQt5实现自定义窗口部件Counters
2018/04/20 Python
Python之lambda匿名函数及map和filter的用法
2019/03/05 Python
详解使用PyInstaller将Pygame库编写的小游戏程序打包为exe文件
2019/08/23 Python
tensorflow 获取所有variable或tensor的name示例
2020/01/04 Python
Python GUI库PyQt5图形和特效样式QSS介绍
2020/02/25 Python
python如何运行js语句
2020/09/09 Python
详解Scrapy Redis入门实战
2020/11/18 Python
一个入门级python爬虫教程详解
2021/01/27 Python
父母对孩子说的话
2014/04/12 职场文书
golang DNS服务器的简单实现操作
2021/04/30 Golang