利用Python抓取行政区划码的方法


Posted in Python onNovember 28, 2016

前言

国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。

注意:抓取下来以后还要进行简单的人工的整理

示例代码:

# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
 get_xzqh()

注意事项:

另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:\Program Files\Tencent\QQ\I18N\2052

如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的,极易导入数据库。

总结

以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。

Python 相关文章推荐
Python判断字符串与大小写转换
Jun 08 Python
Python教程之全局变量用法
Jun 27 Python
Python实现多进程共享数据的方法分析
Dec 04 Python
浅谈Python NLP入门教程
Dec 25 Python
python ddt数据驱动最简实例代码
Feb 22 Python
python面向对象法实现图书管理系统
Apr 19 Python
Python弹出输入框并获取输入值的实例
Jun 18 Python
Python描述符descriptor使用原理解析
Mar 21 Python
Django+python服务器部署与环境部署教程详解
Mar 30 Python
使用Python爬取Json数据的示例代码
Dec 07 Python
python中PyQuery库用法分享
Jan 15 Python
Python pygame实现中国象棋单机版源码
Jun 20 Python
Python抓取手机号归属地信息示例代码
Nov 28 #Python
Python文本相似性计算之编辑距离详解
Nov 28 #Python
Python实现全角半角字符互转的方法
Nov 28 #Python
Python连接PostgreSQL数据库的方法
Nov 28 #Python
windows及linux环境下永久修改pip镜像源的方法
Nov 28 #Python
Python如何为图片添加水印
Nov 25 #Python
Python pass详细介绍及实例代码
Nov 24 #Python
You might like
php中比较简单的导入phpmyadmin生成的sql文件的方法
2011/06/28 PHP
Linux下PHP安装mcrypt扩展模块笔记
2014/09/10 PHP
WordPress中对访客评论功能的一些优化方法
2015/11/24 PHP
laravel学习教程之存取器
2016/07/30 PHP
PHP用PDO如何封装简单易用的DB类详解
2017/07/30 PHP
php命令行模式代码实例详解
2021/02/26 PHP
JQuery事件e参数的方法preventDefault()取消默认行为
2013/09/26 Javascript
js 立即调用的函数表达式如何写
2014/01/12 Javascript
提取jquery的ready()方法单独使用示例
2014/03/25 Javascript
js弹出确认是否删除对话框
2014/03/27 Javascript
javascript中的nextSibling使用陷(da)阱(keng)
2014/05/05 Javascript
举例讲解JavaScript substring()的使用方法
2015/11/09 Javascript
input点击后placeholder中的提示消息消失
2016/01/15 Javascript
JavaScript实现经纬度转换成地址功能
2017/03/28 Javascript
JavaScript&quot;模拟事件&quot;的注意要点详解
2019/02/13 Javascript
Javascript三种字符串连接方式及性能比较
2019/05/28 Javascript
Vue.js实现tab切换效果
2019/07/24 Javascript
nuxt引入组件和公共样式的操作
2020/11/05 Javascript
python根据出生日期获得年龄的方法
2015/03/31 Python
Python lambda函数基本用法实例分析
2018/03/16 Python
12个步骤教你理解Python装饰器
2019/07/01 Python
在python中画正态分布图像的实例
2019/07/08 Python
Python进度条的制作代码实例
2019/08/31 Python
Python 中pandas索引切片读取数据缺失数据处理问题
2019/10/09 Python
美国马匹用品和马钉购物网站:State Line Tack
2018/08/05 全球购物
国际领先的在线时尚服装和配饰店:DressLily
2019/03/03 全球购物
Charles & Keith欧盟:新加坡时尚品牌
2019/08/01 全球购物
岗位职责的含义
2013/11/17 职场文书
劳动模范事迹材料
2014/01/19 职场文书
劳动纠纷调解协议书格式
2014/11/30 职场文书
2014年教研室工作总结
2014/12/06 职场文书
明确岗位职责
2015/02/14 职场文书
副校长2015年教育教学工作总结
2015/07/27 职场文书
2019年冬至:天冷暖人心的问候祝福语大全
2019/12/20 职场文书
elasticSearch-api的具体操作步骤讲解
2021/06/28 Java/Android
Arthas排查Kubernetes中应用频繁挂掉重启异常
2022/02/28 MySQL