Python使用bs4获取58同城城市分类的方法


Posted in Python onJuly 08, 2015

本文实例讲述了Python使用bs4获取58同城城市分类的方法。分享给大家供大家参考。具体如下:

# -*- coding:utf-8 -*-
#! /usr/bin/python
import urllib
import os, datetime, sys
from bs4 import BeautifulSoup
reload(sys) 
sys.setdefaultencoding( "utf-8" ) 
__BASEURL__ = "http://bj.58.com/"
__INITURL__ = "http://bj.58.com/hezu/"
soup=BeautifulSoup(urllib.urlopen(__INITURL__))
lv1Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem')('a',href=True)
f=open('data.txt', 'w')
for element in lv1Elements[1:]:
  f.write((element.get_text() + '\r\n'))
  print element.get_text()
  url = __BASEURL__ + element.get('href')
  print url
  soup=BeautifulSoup(urllib.urlopen(url))
  lv2Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem').find('div', 'subarea').find_all('a')
  texts = [t.get_text() for t in lv2Elements]
  f.write(' '.join(texts) + '\r\n\r\n')
f.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
windows系统中python使用rar命令压缩多个文件夹示例
May 06 Python
在Python的Django框架中创建语言文件
Jul 27 Python
Python入门_条件控制(详解)
May 16 Python
python中通过预先编译正则表达式提高效率
Sep 25 Python
简单了解OpenCV是个什么东西
Nov 10 Python
python微信公众号开发简单流程
Mar 23 Python
Python 实现「食行生鲜」签到领积分功能
Sep 26 Python
python实现图像检索的三种(直方图/OpenCV/哈希法)
Aug 08 Python
python 遗传算法求函数极值的实现代码
Feb 11 Python
如何搭建pytorch环境的方法步骤
May 06 Python
python实现黄金分割法的示例代码
Apr 28 Python
Python代码风格与编程习惯重要吗?
Jun 03 Python
Python实现批量修改文件名实例
Jul 08 #Python
Python查询阿里巴巴关键字排名的方法
Jul 08 #Python
浅谈Python中的闭包
Jul 08 #Python
Python中atexit模块的基本使用示例
Jul 08 #Python
python登录豆瓣并发帖的方法
Jul 08 #Python
python发送HTTP请求的方法小结
Jul 08 #Python
python友情链接检查方法
Jul 08 #Python
You might like
PHP 和 MySQL 基础教程(二)
2006/10/09 PHP
php_screw 1.5:php加密: 安装与使用详解
2013/06/20 PHP
浅谈web上存漏洞及原理分析、防范方法(安全文件上存方法)
2013/06/29 PHP
thinkphp验证码显示不出来的解决方法
2014/03/29 PHP
ThinkPHP跳转页success及error模板实例教程
2014/07/17 PHP
PHP批量获取网页中所有固定种子链接的方法
2016/11/18 PHP
PHP抽象类和接口用法实例详解
2019/07/20 PHP
刷新时清空文本框内容的js代码
2007/04/23 Javascript
Knockoutjs快速入门(经典)
2012/12/24 Javascript
jquery 隐藏与显示tr标签示例代码
2014/06/06 Javascript
JS实现定时自动关闭DIV层提示框的方法
2015/05/11 Javascript
跟我学习javascript的异步脚本加载
2015/11/20 Javascript
学习JavaScript鼠标响应事件
2015/12/25 Javascript
Vue 过渡实现轮播图效果
2017/03/27 Javascript
实例学习JavaScript读取和写入cookie
2018/01/29 Javascript
nodejs实现用户登录路由功能
2019/05/22 NodeJs
Node.js中console.log()输出彩色字体的方法示例
2019/12/01 Javascript
解决ant-design-vue中menu菜单无法默认展开的问题
2020/10/31 Javascript
运行django项目指定IP和端口的方法
2018/05/14 Python
django中静态文件配置static的方法
2018/05/20 Python
对Python 数组的切片操作详解
2018/07/02 Python
Python3匿名函数用法示例
2018/07/25 Python
python3 爬取图片的实例代码
2018/11/06 Python
python实现简单五子棋游戏
2019/06/18 Python
详解pandas使用drop_duplicates去除DataFrame重复项参数
2019/08/01 Python
Django框架 查询Extra功能实现解析
2019/09/04 Python
pytorch中nn.Conv1d的用法详解
2019/12/31 Python
Numpy 多维数据数组的实现
2020/06/18 Python
python中取绝对值简单方法总结
2020/07/24 Python
Pytorch之Tensor和Numpy之间的转换的实现方法
2020/09/03 Python
Spy++的使用方法及下载教程
2021/01/29 Python
成人大专自我鉴定范文
2013/10/19 职场文书
机械系毕业生求职信
2014/05/28 职场文书
四风查摆剖析材料
2014/10/10 职场文书
辞职信如何写
2015/02/27 职场文书
redis lua限流算法实现示例
2022/07/15 Redis