使用python BeautifulSoup库抓取58手机维修信息


Posted in Python onNovember 21, 2013

直接上代码:

#!/usr/bin/python
# -*- coding: utf-8 -*-
import urllib
import os,datetime,string
import sys
from bs4 import BeautifulSoup
reload(sys)
sys.setdefaultencoding('utf-8')
__BASEURL__ = 'http://bj.58.com/'
__INITURL__ = "http://bj.58.com/shoujiweixiu/"
soup = BeautifulSoup(urllib.urlopen(__INITURL__))
lvlELements = soup.html.body.find('div','selectbarTable').find('tr').find_next_sibling('tr')('a',href=True)
f = open('data1.txt','a')
for element in lvlELements[1:]:
    f.write((element.get_text()+'\n\r' ))
    url = __BASEURL__ + element.get('href')
    print url
    soup = BeautifulSoup(urllib.urlopen(url))
    lv2ELements = soup.html.body.find('table','tblist').find_all('tr')
    for item in lv2ELements:
        addr = item.find('td','t').find('a').get_text()
        phone = item.find('td','tdl').find('b','tele').get_text()
        f.write('地址:'+addr +' 电话:'+ phone + '\r\n\r')
f.close()

直接执行后,存在 data1.txt中就会有商家的地址和电话等信息。
BeautifulSoup  api 的地址为: http://www.crummy.com/software/BeautifulSoup/bs4/doc/

Python 相关文章推荐
对于Python装饰器使用的一些建议
Jun 03 Python
python从入门到精通(DAY 3)
Dec 20 Python
python监控linux内存并写入mongodb(推荐)
Sep 11 Python
Python如何快速上手? 快速掌握一门新语言的方法
Nov 14 Python
解决Pycharm界面的子窗口不见了的问题
Jan 17 Python
python3.6根据m3u8下载mp4视频
Jun 17 Python
基于Python实现签到脚本过程解析
Oct 25 Python
Python sql注入 过滤字符串的非法字符实例
Apr 03 Python
django数据模型中null和blank的区别说明
Sep 02 Python
详解Python3.8+PyQt5+pyqt5-tools+Pycharm配置详细教程
Nov 02 Python
Python爬虫scrapy框架Cookie池(微博Cookie池)的使用
Jan 13 Python
python向xls写入数据(包括合并,边框,对齐,列宽)
Feb 02 Python
python BeautifulSoup使用方法详解
Nov 21 #Python
python装饰器使用方法实例
Nov 21 #Python
tornado框架blog模块分析与使用
Nov 21 #Python
python迭代器的使用方法实例
Nov 21 #Python
python生成器的使用方法
Nov 21 #Python
python单链表实现代码实例
Nov 21 #Python
python双向链表实现实例代码
Nov 21 #Python
You might like
数据库的日期格式转换
2006/10/09 PHP
php执行sql语句的写法
2009/03/10 PHP
PHP 处理图片的类实现代码
2009/10/23 PHP
PHP中大于2038年时间戳的问题处理方案
2015/03/03 PHP
php实现SAE上使用storage上传与下载文件的方法
2015/06/29 PHP
PHP实现对数组分页处理实例详解
2017/02/07 PHP
thinkPHP5.0框架事务处理操作简单示例
2018/09/07 PHP
javascript 哈希表(hashtable)的简单实现
2010/01/20 Javascript
JS 树形递归实例代码
2010/05/18 Javascript
javascript浏览器窗口之间传递数据的方法
2015/01/20 Javascript
JQuery radio(单选按钮)操作方法汇总
2015/04/15 Javascript
js仿微博实现统计字符和本地存储功能
2015/12/22 Javascript
angularjs表格ng-table使用备忘录
2016/03/09 Javascript
微信小程序自定义toast实现方法详解【附demo源码下载】
2017/11/28 Javascript
微信小程序开发实现的IP地址查询功能示例
2019/03/28 Javascript
Vue2.x通用条件搜索组件的封装及应用详解
2019/05/28 Javascript
中级前端工程师必须要掌握的27个JavaScript 技巧(干货总结)
2019/09/23 Javascript
浅谈webpack和webpack-cli模块源码分析
2020/01/19 Javascript
ES6学习笔记之字符串、数组、对象、函数新增知识点实例分析
2020/01/22 Javascript
Python爬虫实例_利用百度地图API批量获取城市所有的POI点
2018/01/10 Python
Python数据结构之哈夫曼树定义与使用方法示例
2018/04/22 Python
Python BS4库的安装与使用详解
2018/08/08 Python
详解pycharm连接不上mysql数据库的解决办法
2020/01/10 Python
Python如何把Spark数据写入ElasticSearch
2020/04/18 Python
台湾母婴用品购物网站:Infant婴之房
2018/06/15 全球购物
C/C++程序员常见面试题一
2012/12/08 面试题
校三好学生主要事迹
2014/01/11 职场文书
好军嫂事迹材料
2014/01/15 职场文书
体操比赛口号
2014/06/10 职场文书
计算机实训报告范文
2014/11/05 职场文书
后勤工作个人总结
2015/02/28 职场文书
2015年事业单位工作总结
2015/04/27 职场文书
关于倡议书的范文
2015/04/29 职场文书
2015年统战工作总结
2015/05/19 职场文书
送给教师们,到底该如何写好教学反思?
2019/07/02 职场文书
详解jQuery的核心函数和事件处理
2022/02/18 jQuery