Python使用bs4获取58同城城市分类的方法


Posted in Python onJuly 08, 2015

本文实例讲述了Python使用bs4获取58同城城市分类的方法。分享给大家供大家参考。具体如下:

# -*- coding:utf-8 -*-
#! /usr/bin/python
import urllib
import os, datetime, sys
from bs4 import BeautifulSoup
reload(sys) 
sys.setdefaultencoding( "utf-8" ) 
__BASEURL__ = "http://bj.58.com/"
__INITURL__ = "http://bj.58.com/hezu/"
soup=BeautifulSoup(urllib.urlopen(__INITURL__))
lv1Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem')('a',href=True)
f=open('data.txt', 'w')
for element in lv1Elements[1:]:
  f.write((element.get_text() + '\r\n'))
  print element.get_text()
  url = __BASEURL__ + element.get('href')
  print url
  soup=BeautifulSoup(urllib.urlopen(url))
  lv2Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem').find('div', 'subarea').find_all('a')
  texts = [t.get_text() for t in lv2Elements]
  f.write(' '.join(texts) + '\r\n\r\n')
f.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python的消息队列包SnakeMQ使用初探
Jun 29 Python
python logging 日志轮转文件不删除问题的解决方法
Aug 02 Python
Python实现多线程的两种方式分析
Aug 29 Python
基于随机梯度下降的矩阵分解推荐算法(python)
Aug 31 Python
python selenium firefox使用详解
Feb 26 Python
在pyqt5中QLineEdit里面的内容回车发送的实例
Jun 21 Python
python读取图片的方式,以及将图片以三维数组的形式输出方法
Jul 03 Python
pycharm中显示CSS提示的知识点总结
Jul 29 Python
Python3 JSON编码解码方法详解
Sep 06 Python
python中68个内置函数的总结与介绍
Feb 24 Python
TensorFlow打印输出tensor的值
Apr 19 Python
详解基于python的全局与局部序列比对的实现(DNA)
Oct 07 Python
Python实现批量修改文件名实例
Jul 08 #Python
Python查询阿里巴巴关键字排名的方法
Jul 08 #Python
浅谈Python中的闭包
Jul 08 #Python
Python中atexit模块的基本使用示例
Jul 08 #Python
python登录豆瓣并发帖的方法
Jul 08 #Python
python发送HTTP请求的方法小结
Jul 08 #Python
python友情链接检查方法
Jul 08 #Python
You might like
php利用cookie实现访问次数统计代码
2011/05/19 PHP
php学习之function的用法
2012/07/14 PHP
thinkphp5.1框架模板赋值与变量输出示例
2020/05/25 PHP
一段非常简单的让图片自动切换js代码
2006/11/10 Javascript
JavaScript 学习笔记(六)
2009/12/31 Javascript
javascript中数组方法汇总
2015/07/07 Javascript
AngularJS实现textarea记录只能输入规定数量的字符并显示
2016/04/26 Javascript
JavaScript基础重点(必看)
2016/07/09 Javascript
深入理解vue路由的使用
2017/03/24 Javascript
整理关于Bootstrap列表组的慕课笔记
2017/03/29 Javascript
详解angularjs中的隔离作用域理解以及绑定策略
2017/05/31 Javascript
详解使用Vue Router导航钩子与Vuex来实现后退状态保存
2017/09/11 Javascript
JS严格模式知识点总结
2018/02/27 Javascript
微信小程序实现通过双向滑动缩放图片大小的方法
2018/12/30 Javascript
vue中created和mounted的区别浅析
2019/08/13 Javascript
js实现轮播图特效
2020/05/28 Javascript
vue实现虚拟列表功能的代码
2020/07/28 Javascript
Python通过递归遍历出集合中所有元素的方法
2015/02/25 Python
K-means聚类算法介绍与利用python实现的代码示例
2017/11/13 Python
python编程使用selenium模拟登陆淘宝实例代码
2018/01/25 Python
Python使用Selenium模块模拟浏览器抓取斗鱼直播间信息示例
2018/07/18 Python
python中从for循环延申到推导式的具体使用
2019/11/29 Python
flask框架蓝图和子域名配置详解
2020/01/25 Python
Python列表list操作相关知识小结
2020/01/29 Python
全球航班旅行搜索网站:Cheapflights
2017/05/19 全球购物
手工制作的意大利太阳镜和光学元件:Illesteva
2019/01/19 全球购物
Geekbuying波兰:购买中国电子产品
2019/10/20 全球购物
上海天奕面试题笔试题
2015/04/19 面试题
教学改革实施方案
2014/03/31 职场文书
2014年党员承诺书范文
2014/05/20 职场文书
农业项目建议书
2014/08/25 职场文书
教师节领导致辞
2015/07/29 职场文书
安全生产会议制度
2015/08/06 职场文书
MySQL中distinct和count(*)的使用方法比较
2021/05/26 MySQL
Go语言应该什么情况使用指针
2021/07/25 Golang
Java由浅入深通关抽象类与接口(上篇)
2022/04/26 Java/Android