利用Python抓取行政区划码的方法


Posted in Python onNovember 28, 2016

前言

国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。

注意:抓取下来以后还要进行简单的人工的整理

示例代码:

# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
 get_xzqh()

注意事项:

另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:\Program Files\Tencent\QQ\I18N\2052

如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的,极易导入数据库。

总结

以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。

Python 相关文章推荐
Django框架下在URLconf中指定视图缓存的方法
Jul 23 Python
Python多进程分块读取超大文件的方法
Apr 13 Python
python如何重载模块实例解析
Jan 25 Python
python web基础之加载静态文件实例
Mar 20 Python
python requests爬取高德地图数据的实例
Nov 10 Python
python调用opencv实现猫脸检测功能
Jan 15 Python
对于Python深浅拷贝的理解
Jul 29 Python
使用Puppeteer爬取微信文章的实现
Feb 11 Python
linux 下selenium chrome使用详解
Apr 02 Python
Python实现王者荣耀自动刷金币的完整步骤
Jan 22 Python
Python初识逻辑与if语句及用法大全
Aug 07 Python
python解析json数据
Apr 29 Python
Python抓取手机号归属地信息示例代码
Nov 28 #Python
Python文本相似性计算之编辑距离详解
Nov 28 #Python
Python实现全角半角字符互转的方法
Nov 28 #Python
Python连接PostgreSQL数据库的方法
Nov 28 #Python
windows及linux环境下永久修改pip镜像源的方法
Nov 28 #Python
Python如何为图片添加水印
Nov 25 #Python
Python pass详细介绍及实例代码
Nov 24 #Python
You might like
磨咖啡豆的密诀
2021/03/03 冲泡冲煮
php文件夹与文件目录操作函数介绍
2013/09/09 PHP
通过PHP实现获取访问用户IP
2020/05/09 PHP
jquery实现兼容浏览器的图片上传本地预览功能
2013/10/14 Javascript
jquery实现手机发送验证码的倒计时代码
2014/02/12 Javascript
JavaScript访问CSS属性的几种方式介绍
2014/07/21 Javascript
JavaScript AJAX之惰性载入函数
2014/08/27 Javascript
node.js中的events.EventEmitter.listenerCount方法使用说明
2014/12/08 Javascript
jQuery聚合函数实例
2015/05/21 Javascript
在JavaScript的AngularJS库中进行单元测试的方法
2015/06/23 Javascript
前端微信支付js代码
2016/07/25 Javascript
十个免费的web前端开发工具详细整理
2017/09/18 Javascript
js 两个日期比较相差多少天的实例
2017/10/19 Javascript
浅析Angular19 自定义表单控件
2018/01/31 Javascript
vue实现打地鼠小游戏
2020/08/21 Javascript
用Python中的__slots__缓存资源以节省内存开销的方法
2015/04/02 Python
Python中map和列表推导效率比较实例分析
2015/06/17 Python
对python实时得到鼠标位置的示例讲解
2018/10/14 Python
PyCharm设置每行最大长度限制的方法
2019/01/16 Python
Python_查看sqlite3表结构,查询语句的示例代码
2019/07/17 Python
Django模型修改及数据迁移实现解析
2019/08/01 Python
Python实现AI自动抠图实例解析
2020/03/05 Python
哪些是python中web开发框架
2020/06/17 Python
常用的10个Python实用小技巧
2020/08/10 Python
Python面向对象多态实现原理及代码实例
2020/09/16 Python
python 使用xlsxwriter循环向excel中插入数据和图片的操作
2021/01/01 Python
HTML5手指下滑弹出负一屏阻止移动端浏览器内置下拉刷新功能的实现代码
2020/04/10 HTML / CSS
Sneaker Studio波兰:购买运动鞋
2018/04/28 全球购物
大型会议接待方案
2014/03/01 职场文书
五五普法心得体会
2014/09/04 职场文书
2014年驻村干部工作总结
2014/11/17 职场文书
事业单位年度考核评语
2014/12/31 职场文书
计算机专业自荐信
2015/03/05 职场文书
二审答辩状格式
2015/05/22 职场文书
正规借条模板
2015/05/26 职场文书
js之ajax文件上传
2021/05/13 Javascript