Python使用bs4获取58同城城市分类的方法


Posted in Python onJuly 08, 2015

本文实例讲述了Python使用bs4获取58同城城市分类的方法。分享给大家供大家参考。具体如下:

# -*- coding:utf-8 -*-
#! /usr/bin/python
import urllib
import os, datetime, sys
from bs4 import BeautifulSoup
reload(sys) 
sys.setdefaultencoding( "utf-8" ) 
__BASEURL__ = "http://bj.58.com/"
__INITURL__ = "http://bj.58.com/hezu/"
soup=BeautifulSoup(urllib.urlopen(__INITURL__))
lv1Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem')('a',href=True)
f=open('data.txt', 'w')
for element in lv1Elements[1:]:
  f.write((element.get_text() + '\r\n'))
  print element.get_text()
  url = __BASEURL__ + element.get('href')
  print url
  soup=BeautifulSoup(urllib.urlopen(url))
  lv2Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem').find('div', 'subarea').find_all('a')
  texts = [t.get_text() for t in lv2Elements]
  f.write(' '.join(texts) + '\r\n\r\n')
f.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
编写自定义的Django模板加载器的简单示例
Jul 21 Python
深入解析Python编程中super关键字的用法
Jun 24 Python
python递归删除指定目录及其所有内容的方法
Jan 13 Python
pycharm远程调试openstack的图文教程
Nov 21 Python
python+unittest+requests实现接口自动化的方法
Nov 29 Python
python爬虫爬取幽默笑话网站
Oct 24 Python
python与mysql数据库交互的实现
Jan 06 Python
pytorch-神经网络拟合曲线实例
Jan 15 Python
Python爬虫过程解析之多线程获取小米应用商店数据
Nov 14 Python
使用python向MongoDB插入时间字段的操作
May 18 Python
Python自动化爬取天眼查数据的实现
Jun 15 Python
Python使用Opencv打开笔记本电脑摄像头报错解问题及解决
Jun 21 Python
Python实现批量修改文件名实例
Jul 08 #Python
Python查询阿里巴巴关键字排名的方法
Jul 08 #Python
浅谈Python中的闭包
Jul 08 #Python
Python中atexit模块的基本使用示例
Jul 08 #Python
python登录豆瓣并发帖的方法
Jul 08 #Python
python发送HTTP请求的方法小结
Jul 08 #Python
python友情链接检查方法
Jul 08 #Python
You might like
laravel + vue实现的数据统计绘图(今天、7天、30天数据)
2018/07/31 PHP
PHP实现微信退款功能
2018/10/02 PHP
js压缩利器
2007/02/20 Javascript
基于jquery的从一个页面跳转到另一个页面的指定位置的实现代码(带平滑移动的效果)
2011/05/24 Javascript
JavaScript 选中文字并响应获取的实现代码
2011/08/28 Javascript
ActiveX控件与Javascript之间的交互示例
2014/06/04 Javascript
JavaScript去除数组里重复值的方法
2015/07/13 Javascript
继续学习javascript闭包
2015/12/03 Javascript
常用js,css文件统一加载方法(推荐) 并在加载之后调用回调函数
2016/09/23 Javascript
Ajax与服务器(JSON)通信实例代码
2016/11/05 Javascript
微信小程序 textarea 详解及简单使用方法
2016/12/05 Javascript
Vue 父子组件、组件间通信
2017/03/08 Javascript
JS中定位 position 的使用实例代码
2017/08/06 Javascript
AjaxFileUpload.js实现异步上传文件功能
2019/04/19 Javascript
JS实现动态星空背景效果
2019/11/01 Javascript
Python3计算三角形的面积代码
2017/12/18 Python
Python给定一个句子倒序输出单词以及字母的方法
2018/12/20 Python
对Python3.x版本print函数左右对齐详解
2018/12/22 Python
python覆盖写入,追加写入的实例
2019/06/26 Python
利用pyecharts实现地图可视化的例子
2019/08/12 Python
python argparse传入布尔参数false不生效的解决
2020/04/20 Python
Python实现疫情通定时自动填写功能(附代码)
2020/05/27 Python
Python接口测试环境搭建过程详解
2020/06/29 Python
Python中免验证跳转到内容页的实例代码
2020/10/23 Python
python 逆向爬虫正确调用 JAR 加密逻辑
2021/01/12 Python
详解Python中的GIL(全局解释器锁)详解及解决GIL的几种方案
2021/01/29 Python
详解如何在css3打包后自动追加前缀插件:autoprefixer
2018/12/18 HTML / CSS
关于html字符串正则判断和匹配的具体使用
2019/12/12 HTML / CSS
LTD Commodities:礼品,独特发现,家居装饰,家用器皿
2017/08/11 全球购物
舞蹈教育学专业推荐信
2013/11/27 职场文书
公证委托书模板
2014/04/03 职场文书
公司副总经理任命书
2014/06/05 职场文书
2015年毕业生自我鉴定模板
2014/09/19 职场文书
三方股份合作协议书
2014/10/13 职场文书
师范生见习总结范文
2015/06/23 职场文书
党组织关系的介绍信模板
2019/06/21 职场文书