Python使用bs4获取58同城城市分类的方法


Posted in Python onJuly 08, 2015

本文实例讲述了Python使用bs4获取58同城城市分类的方法。分享给大家供大家参考。具体如下:

# -*- coding:utf-8 -*-
#! /usr/bin/python
import urllib
import os, datetime, sys
from bs4 import BeautifulSoup
reload(sys) 
sys.setdefaultencoding( "utf-8" ) 
__BASEURL__ = "http://bj.58.com/"
__INITURL__ = "http://bj.58.com/hezu/"
soup=BeautifulSoup(urllib.urlopen(__INITURL__))
lv1Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem')('a',href=True)
f=open('data.txt', 'w')
for element in lv1Elements[1:]:
  f.write((element.get_text() + '\r\n'))
  print element.get_text()
  url = __BASEURL__ + element.get('href')
  print url
  soup=BeautifulSoup(urllib.urlopen(url))
  lv2Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem').find('div', 'subarea').find_all('a')
  texts = [t.get_text() for t in lv2Elements]
  f.write(' '.join(texts) + '\r\n\r\n')
f.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
python实现逆波兰计算表达式实例详解
May 06 Python
Python聚类算法之凝聚层次聚类实例分析
Nov 20 Python
详解Python编程中time模块的使用
Nov 20 Python
Python3.X 线程中信号量的使用方法示例
Jul 24 Python
Python多进程库multiprocessing中进程池Pool类的使用详解
Nov 24 Python
儿童编程python入门
May 08 Python
python 解决cv2绘制中文乱码问题
Dec 23 Python
Python3标准库之dbm UNIX键-值数据库问题
Mar 24 Python
解决keras使用cov1D函数的输入问题
Jun 29 Python
使用Python Tkinter实现剪刀石头布小游戏功能
Oct 23 Python
Python 如何将integer转化为罗马数(3999以内)
Jun 05 Python
Python自动化实战之接口请求的实现
May 30 Python
Python实现批量修改文件名实例
Jul 08 #Python
Python查询阿里巴巴关键字排名的方法
Jul 08 #Python
浅谈Python中的闭包
Jul 08 #Python
Python中atexit模块的基本使用示例
Jul 08 #Python
python登录豆瓣并发帖的方法
Jul 08 #Python
python发送HTTP请求的方法小结
Jul 08 #Python
python友情链接检查方法
Jul 08 #Python
You might like
PHP加速 eAccelerator配置和使用指南
2009/06/05 PHP
PHP缓存技术的使用说明
2011/08/06 PHP
php数组函数序列 之array_count_values() 统计数组中所有值出现的次数函数
2011/10/29 PHP
PHP生成word文档的三种实现方式
2016/11/14 PHP
Javascript 生成指定范围数值随机数
2009/01/09 Javascript
Extjs在exlipse中设置自动提示的方法
2010/04/07 Javascript
jquery.cvtooltip.js 基于jquery的气泡提示插件
2010/11/19 Javascript
js截取小数点后几位的写法
2013/11/14 Javascript
jquery validate添加自定义验证规则(验证邮箱 邮政编码)
2013/12/04 Javascript
NODE.JS加密模块CRYPTO常用方法介绍
2014/06/05 Javascript
JS小游戏之象棋暗棋源码详解
2014/09/25 Javascript
详解Matlab中 sort 函数用法
2016/03/20 Javascript
Jquery获取第一个子元素简单实例
2016/06/02 Javascript
给easyui datebox扩展一个清空的实例
2016/11/09 Javascript
Spring Boot+AngularJS+BootStrap实现进度条示例代码
2017/03/02 Javascript
JavaScript限制在客户区可见范围的拖拽(解决scrollLeft和scrollTop的问题)(2)
2017/05/17 Javascript
JavaWeb表单及时验证功能在输入后立即验证(含用户类型,性别,爱好...的验证)
2017/06/09 Javascript
js中时间格式化的几种方法
2018/07/22 Javascript
[01:10]DOTA2次级职业联赛 - U5战队宣传片
2014/12/01 DOTA
Python入门篇之字符串
2014/10/17 Python
Python调用C++程序的方法详解
2017/01/24 Python
Django的HttpRequest和HttpResponse对象详解
2018/01/26 Python
便捷提取python导入包的属性方法
2018/10/15 Python
pytorch 彩色图像转灰度图像实例
2020/01/13 Python
Python3 读取Word文件方式
2020/02/13 Python
解决pycharm不能自动补全第三方库的函数和属性问题
2020/03/12 Python
基于Python把网站域名解析成ip地址
2020/05/25 Python
python 密码学示例——理解哈希(Hash)算法
2020/09/21 Python
美国设计师精美珠宝购物网:Netaya
2016/08/28 全球购物
罗兰·穆雷官网:Roland Mouret
2018/09/28 全球购物
关联、聚合(Aggregation)以及组合(Composition)的区别
2012/02/29 面试题
优秀大学生的自我评价
2014/01/16 职场文书
《荷花》教学反思
2014/04/16 职场文书
贯彻落实“八项规定”思想汇报
2014/09/13 职场文书
上市公司财务总监岗位职责
2015/04/03 职场文书
2015年街道办事处团委工作总结
2015/10/14 职场文书