利用Python抓取行政区划码的方法


Posted in Python onNovember 28, 2016

前言

国家统计局网站上有相对比较齐的行政区划码,对于一些网站来说这是非常基础的数据,所以写了个Python程序将这部分数据抓取下来。

注意:抓取下来以后还要进行简单的人工的整理

示例代码:

# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
 get_xzqh()

注意事项:

另外,关于国家地区表的信息,还有另外一种获取渠道,那就是QQ软件自带的国家地区信息表。(文件名为LocList.xml),一般的存储位置为:C:\Program Files\Tencent\QQ\I18N\2052

如需中文版安装中文版QQ即可获取,如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的,极易导入数据库。

总结

以上就是利用Python获取行政区划码的全部内容,希望本文的内容对大家学习或者使用python能有所帮助,如果有疑问大家可以留言交流。

Python 相关文章推荐
Python3基础之输入和输出实例分析
Aug 18 Python
10款最好的Web开发的 Python 框架
Mar 18 Python
python去除文件中空格、Tab及回车的方法
Apr 12 Python
Python常用字符串替换函数strip、replace及sub用法示例
May 21 Python
点球小游戏python脚本
May 22 Python
快速解决pandas.read_csv()乱码的问题
Jun 15 Python
python随机数分布random测试
Aug 27 Python
python实现感知机线性分类模型示例代码
Jun 02 Python
python之pyqt5通过按钮改变Label的背景颜色方法
Jun 13 Python
如何理解python面向对象编程
Jun 01 Python
Python爬取12306车次信息代码详解
Aug 12 Python
pycharm2020.1.2永久破解激活教程,实测有效
Oct 29 Python
Python抓取手机号归属地信息示例代码
Nov 28 #Python
Python文本相似性计算之编辑距离详解
Nov 28 #Python
Python实现全角半角字符互转的方法
Nov 28 #Python
Python连接PostgreSQL数据库的方法
Nov 28 #Python
windows及linux环境下永久修改pip镜像源的方法
Nov 28 #Python
Python如何为图片添加水印
Nov 25 #Python
Python pass详细介绍及实例代码
Nov 24 #Python
You might like
虹吸式咖啡探讨–研磨
2021/03/03 冲泡冲煮
php仿discuz分页效果代码
2008/10/02 PHP
让PHP显示Facebook的粉丝数量方法
2014/01/08 PHP
CodeIgniter框架常见用法工作总结
2017/03/16 PHP
gearman中任务的优先级和返回状态实例分析
2020/02/27 PHP
web页面数据展示新想法(json)
2010/06/08 Javascript
JavaScript经典效果集锦
2010/07/06 Javascript
Javascript面向对象扩展库代码分享
2012/03/27 Javascript
jquery实现动态菜单的实例代码
2013/11/28 Javascript
JsRender for index循环索引用法详解
2014/10/31 Javascript
基于JS实现省市联动效果代码分享
2016/06/06 Javascript
vue.js学习之UI组件开发教程
2017/07/03 Javascript
js中的闭包学习心得
2018/02/06 Javascript
浅谈es6中export和export default的作用及区别
2018/02/07 Javascript
video.js 实现视频只能后退不能快进的思路详解
2018/08/09 Javascript
Vue.js中使用iView日期选择器并设置开始时间结束时间校验功能
2018/08/12 Javascript
Vue中的作用域CSS和CSS模块的区别
2018/10/09 Javascript
原生js实现html手机端城市列表索引选择城市
2020/06/24 Javascript
React倒计时功能实现代码——解耦通用
2020/09/18 Javascript
[40:56]2018DOTA2亚洲邀请赛 3.31 小组赛 A组 Liquid vs TNC
2018/04/01 DOTA
python操作CouchDB的方法
2014/10/08 Python
Python连接mysql数据库的正确姿势
2016/02/03 Python
django1.8使用表单上传文件的实现方法
2016/11/04 Python
python处理xml文件的方法小结
2017/05/02 Python
Django验证码的生成与使用示例
2017/05/20 Python
Python适配器模式代码实现解析
2019/08/02 Python
python 实现快速生成连续、随机字母列表
2019/11/28 Python
python sitk.show()与imageJ结合使用常见的问题
2020/04/20 Python
人力资源管理专业学生自我评价
2013/11/20 职场文书
优秀毕业生求职信
2014/06/05 职场文书
小学教师自我剖析材料
2014/09/29 职场文书
环保证明
2015/06/23 职场文书
师德师风心得体会(2016精选篇)
2016/01/12 职场文书
教师学习心得体会范文
2016/01/21 职场文书
《角的度量》教学反思
2016/02/18 职场文书
使用python生成大量数据写入es数据库并查询操作(2)
2022/09/23 Python