Python使用bs4获取58同城城市分类的方法


Posted in Python onJuly 08, 2015

本文实例讲述了Python使用bs4获取58同城城市分类的方法。分享给大家供大家参考。具体如下:

# -*- coding:utf-8 -*-
#! /usr/bin/python
import urllib
import os, datetime, sys
from bs4 import BeautifulSoup
reload(sys) 
sys.setdefaultencoding( "utf-8" ) 
__BASEURL__ = "http://bj.58.com/"
__INITURL__ = "http://bj.58.com/hezu/"
soup=BeautifulSoup(urllib.urlopen(__INITURL__))
lv1Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem')('a',href=True)
f=open('data.txt', 'w')
for element in lv1Elements[1:]:
  f.write((element.get_text() + '\r\n'))
  print element.get_text()
  url = __BASEURL__ + element.get('href')
  print url
  soup=BeautifulSoup(urllib.urlopen(url))
  lv2Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem').find('div', 'subarea').find_all('a')
  texts = [t.get_text() for t in lv2Elements]
  f.write(' '.join(texts) + '\r\n\r\n')
f.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
python str与repr的区别
Mar 23 Python
基于Python和Scikit-Learn的机器学习探索
Oct 16 Python
Django开发中复选框用法示例
Mar 20 Python
Python实现基于TCP UDP协议的IPv4 IPv6模式客户端和服务端功能示例
Mar 22 Python
python之从文件读取数据到list的实例讲解
Apr 19 Python
Jupyter notebook远程访问服务器的方法
May 24 Python
python 获取键盘输入,同时有超时的功能示例
Nov 13 Python
python列表,字典,元组简单用法示例
Jul 11 Python
Python和Anaconda和Pycharm安装教程图文详解
Feb 04 Python
python logging通过json文件配置的步骤
Apr 27 Python
Python中BeautifulSoup通过查找Id获取元素信息
Dec 07 Python
python基础之类方法和静态方法
Oct 24 Python
Python实现批量修改文件名实例
Jul 08 #Python
Python查询阿里巴巴关键字排名的方法
Jul 08 #Python
浅谈Python中的闭包
Jul 08 #Python
Python中atexit模块的基本使用示例
Jul 08 #Python
python登录豆瓣并发帖的方法
Jul 08 #Python
python发送HTTP请求的方法小结
Jul 08 #Python
python友情链接检查方法
Jul 08 #Python
You might like
JavaScript Prototype对象
2009/01/07 Javascript
jQuery子窗体取得父窗体元素的方法
2015/05/11 Javascript
jQuery垂直多级导航菜单代码分享
2015/08/18 Javascript
javascript设计简单的秒表计时器
2020/09/05 Javascript
Highcharts 多个Y轴动态刷新数据的实现代码
2016/05/28 Javascript
AngularJs上传前预览图片的实例代码
2017/01/20 Javascript
原生js实现弹出层效果
2017/01/20 Javascript
nodejs连接mysql数据库简单封装示例-mysql模块
2017/04/10 NodeJs
自定义vue组件发布到npm的方法
2018/05/09 Javascript
vue中关闭eslint的方法分析
2018/08/04 Javascript
vue+element的表格实现批量删除功能示例代码
2018/08/17 Javascript
vue拖拽排序插件vuedraggable使用方法详解
2020/08/21 Javascript
微信小程序生成二维码的示例代码
2019/03/29 Javascript
微信小程序实现批量倒计时功能
2020/11/01 Javascript
vue-cli点击实现全屏功能
2020/03/07 Javascript
vue项目启动出现cannot GET /服务错误的解决方法
2020/04/26 Javascript
Python每天必学之bytes字节
2016/01/28 Python
Python使用字典实现的简单记事本功能示例
2019/08/15 Python
python3 tkinter实现添加图片和文本
2019/11/26 Python
python使用正则来处理各种匹配问题
2019/12/22 Python
Python 通过监听端口实现唯一脚本运行方式
2020/05/05 Python
python 基于UDP协议套接字通信的实现
2021/01/22 Python
HTML5 虚拟键盘出现挡住输入框的解决办法
2017/02/14 HTML / CSS
香港永安旅游网:Wing On Travel
2017/04/10 全球购物
国际知名军事风格休闲装品牌:Alpha Industries(阿尔法工业)
2017/05/24 全球购物
Tessabit日本:集世界奢侈品和设计师品牌的意大利精品买手店
2020/01/07 全球购物
关键字final的用法
2013/10/02 面试题
老总助理工作岗位职责
2014/02/06 职场文书
法制报告会主持词
2014/04/02 职场文书
活动总结怎么写
2014/04/28 职场文书
平安校园建设方案
2014/05/02 职场文书
文明班集体申报材料
2014/05/23 职场文书
煤矿安全生产月活动总结
2014/07/05 职场文书
新郎婚礼答谢词
2015/01/04 职场文书
病假证明模板
2015/06/19 职场文书
六年级作文之自救
2019/12/19 职场文书