利用Python抓取行政区划码的方法


Posted in Python onNovember 28, 2016

前言

国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。

注意:抓取下来以后还要进行简单的人工的整理

示例代码:

# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
 get_xzqh()

注意事项:

另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:\Program Files\Tencent\QQ\I18N\2052

如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的,极易导入数据库。

总结

以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。

Python 相关文章推荐
python以环状形式组合排列图片并输出的方法
Mar 17 Python
在Python中处理字符串之ljust()方法的使用简介
May 19 Python
Python中生成Epoch的方法
Apr 26 Python
Linux CentOS7下安装python3 的方法
Jan 21 Python
[原创]windows下Anaconda的安装与配置正解(Anaconda入门教程)
Apr 05 Python
python XlsxWriter模块创建aexcel表格的实例讲解
May 03 Python
python正向最大匹配分词和逆向最大匹配分词的实例
Nov 14 Python
Django实现学生管理系统
Feb 26 Python
django项目简单调取百度翻译接口的方法
Aug 06 Python
Python开发企业微信机器人每天定时发消息实例
Mar 17 Python
Python常见反爬虫机制解决方案
Jun 01 Python
基于Python+QT的gui程序开发实现
Jul 03 Python
Python抓取手机号归属地信息示例代码
Nov 28 #Python
Python文本相似性计算之编辑距离详解
Nov 28 #Python
Python实现全角半角字符互转的方法
Nov 28 #Python
Python连接PostgreSQL数据库的方法
Nov 28 #Python
windows及linux环境下永久修改pip镜像源的方法
Nov 28 #Python
Python如何为图片添加水印
Nov 25 #Python
Python pass详细介绍及实例代码
Nov 24 #Python
You might like
php function用法如何递归及return和echo区别
2014/03/07 PHP
PHP加密解密函数详解
2015/10/28 PHP
功能强大的PHP POST提交数据类
2016/07/15 PHP
PHP通过CURL实现定时任务的图片抓取功能示例
2016/10/03 PHP
基于jquery的返回顶部效果(兼容IE6)
2011/01/17 Javascript
javascript 保存文件到本地实现方法
2012/11/29 Javascript
JQueryiframe页面操作父页面中的元素与方法(实例讲解)
2013/11/19 Javascript
js/jQuery简单实现选项卡功能
2014/01/02 Javascript
jQuery操作select下拉框的text值和value值的方法
2014/05/31 Javascript
Bootstrap教程JS插件弹出框学习笔记分享
2016/05/17 Javascript
JavaScript的this关键字的理解
2016/06/18 Javascript
vue-cli的webpack模板项目配置文件分析
2017/04/01 Javascript
命令行批量截图Node脚本示例代码
2019/01/25 Javascript
JS中min函数实例讲解
2019/02/18 Javascript
JavaScript函数式编程(Functional Programming)箭头函数(Arrow functions)用法分析
2019/05/22 Javascript
JavaScript如何把两个数组对象合并过程解析
2019/10/10 Javascript
vue之a-table中实现清空选中的数据
2019/11/07 Javascript
javascript实现移动端红包雨页面
2020/06/23 Javascript
[01:30:15]DOTA2-DPC中国联赛 正赛 Ehome vs Aster BO3 第二场 2月2日
2021/03/11 DOTA
Python实例一个类背后发生了什么
2016/02/09 Python
PyQt5每天必学之像素图控件QPixmap
2018/04/19 Python
Python数据结构之图的应用示例
2018/05/11 Python
Python查找数组中数值和下标相等的元素示例【二分查找】
2019/02/13 Python
python实现身份证实名认证的方法实例
2019/11/08 Python
Python 动态变量名定义与调用方法
2020/02/09 Python
Pycharm 2020.1 版配置优化的详细教程
2020/08/07 Python
运行Python编写的程序方法实例
2020/10/21 Python
实习老师个人总结的自我评价
2013/09/28 职场文书
工商管理本科毕业生求职信范文
2013/10/05 职场文书
小学语文教学经验交流材料
2014/06/02 职场文书
求职教师自荐书
2014/06/19 职场文书
2014最新房贷收入证明范本
2014/09/12 职场文书
2014年大班保育员工作总结
2014/12/02 职场文书
《观察物体》教学反思
2016/02/17 职场文书
MySQL 8.0 之不可见列的基本操作
2021/05/20 MySQL
Win10系统搭建ftp文件服务器详细教程
2022/08/05 Servers