利用Python抓取行政区划码的方法


Posted in Python onNovember 28, 2016

前言

国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。

注意:抓取下来以后还要进行简单的人工的整理

示例代码:

# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
 get_xzqh()

注意事项:

另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:\Program Files\Tencent\QQ\I18N\2052

如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的,极易导入数据库。

总结

以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。

Python 相关文章推荐
基于Python实现的扫雷游戏实例代码
Aug 01 Python
Python是编译运行的验证方法
Jan 30 Python
Python THREADING模块中的JOIN()方法深入理解
Feb 18 Python
python的格式化输出(format,%)实例详解
Jun 01 Python
Python读取txt某几列绘图的方法
Oct 14 Python
python打包生成的exe文件运行时提示缺少模块的解决方法
Oct 31 Python
python Selenium实现付费音乐批量下载的实现方法
Jan 24 Python
python requests证书问题解决
Sep 05 Python
python:解析requests返回的response(json格式)说明
Apr 30 Python
python 从list中随机取值的方法
Nov 16 Python
python中常用的数据结构介绍
Jan 12 Python
Python实现信息管理系统
Jun 05 Python
Python抓取手机号归属地信息示例代码
Nov 28 #Python
Python文本相似性计算之编辑距离详解
Nov 28 #Python
Python实现全角半角字符互转的方法
Nov 28 #Python
Python连接PostgreSQL数据库的方法
Nov 28 #Python
windows及linux环境下永久修改pip镜像源的方法
Nov 28 #Python
Python如何为图片添加水印
Nov 25 #Python
Python pass详细介绍及实例代码
Nov 24 #Python
You might like
咖啡与水的关系
2021/03/03 冲泡冲煮
php生成SessionID和图片校验码的思路和实现代码
2009/03/10 PHP
php数组函数序列之each() - 获取数组当前内部指针所指向元素的键名和键值,并将指针移到下一位
2011/10/31 PHP
php判断正常访问和外部访问的示例
2014/02/10 PHP
php判断输入是否是纯数字,英文,汉字的方法
2015/03/05 PHP
Thinkphp开发--集成极光推送
2017/09/15 PHP
编辑浪子版表单验证类
2007/05/12 Javascript
比较简单实用的使用正则三种版本的js去空格处理方法
2007/11/18 Javascript
用js来解决ajax读取页面乱码
2010/11/28 Javascript
JavaScript 上万关键字瞬间匹配实现代码
2013/07/07 Javascript
javascript计算当月剩余天数(天数计算器)示例代码
2014/01/09 Javascript
jquery+json实现分页效果
2016/03/07 Javascript
JavaScript中的boolean布尔值使用学习及相关技巧讲解
2016/05/26 Javascript
Angular2 PrimeNG分页模块学习
2017/01/14 Javascript
tab栏切换原理
2017/03/22 Javascript
详解React Native网络请求fetch简单封装
2017/08/10 Javascript
JavaScript实现音乐自动切换和轮播
2017/11/05 Javascript
微信小程序实现滴滴导航tab切换效果
2018/07/24 Javascript
微信小程序有旋转动画效果的音乐组件实例代码
2018/08/22 Javascript
Vue指令指令大全
2019/02/09 Javascript
JS图片预加载三种实现方法解析
2020/05/08 Javascript
[03:07]DOTA2英雄基础教程 冰霜诅咒极寒幽魂
2013/12/06 DOTA
[01:02:17]2014 DOTA2华西杯精英邀请赛 5 24 DK VS VG
2014/05/26 DOTA
[11:12]2018DOTA2国际邀请赛寻真——绿色长城OpTic
2018/08/10 DOTA
使用Python编写类UNIX系统的命令行工具的教程
2015/04/15 Python
Python实现MySQL操作的方法小结【安装,连接,增删改查等】
2017/07/12 Python
python绘制多个子图的实例
2019/07/07 Python
python基于paramiko将文件上传到服务器代码实现
2019/07/08 Python
Python 如何定义匿名或内联函数
2020/08/01 Python
送给他或她的礼物:FUN.com
2018/08/17 全球购物
玲玲的画教学反思
2014/02/04 职场文书
艺人经纪人岗位职责
2014/04/15 职场文书
学校文明单位申报材料
2014/05/06 职场文书
食品科学与工程专业毕业生求职信范文
2014/07/21 职场文书
高考升学宴答谢词
2015/01/20 职场文书
学会感恩主题班会
2015/08/12 职场文书