基于python爬取链家二手房信息代码示例


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel
  • time

相关模块pip安装即可

确定目标网页数据

基于python爬取链家二手房信息代码示例

哦豁,这个价格..................看到都觉得脑阔疼

通过开发者工具,可以直接找到网页返回的数据~

基于python爬取链家二手房信息代码示例
基于python爬取链家二手房信息代码示例

每一个二手房的数据,都在网页的 li 标签里面,咱们可以获取网页返回的数据,然后通过解析,就可以获取到自己想要的数据了~

获取网页数据

import requests
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

解析网页数据

import parsel
selector = parsel.Selector(response.text)
lis = selector.css('.sellListContent li')
dit = {}
for li in lis:
  title = li.css('.title a::text').get()
  dit['标题'] = title
  positionInfo = li.css('.positionInfo a::text').getall()
  info = '-'.join(positionInfo)
  dit['开发商'] = info
  houseInfo = li.css('.houseInfo::text').get()
  dit['房子信息'] = houseInfo
  followInfo = li.css('.followInfo::text').get()
  dit['发布周期'] = followInfo
  Price = li.css('.totalPrice span::text').get()
  dit['售价/万'] = Price
  unitPrice = li.css('.unitPrice span::text').get()
  dit['单价'] = unitPrice
  csv_writer.writerow(dit)
  print(dit)

基于python爬取链家二手房信息代码示例

保存数据

import csv
f = open('二手房信息.csv', mode='a', encoding='utf-8-sig', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['标题', '开发商', '房子信息', '发布周期', '售价/万', '单价'])
csv_writer.writeheader()
csv_writer.writerow(dit)
f.close()

基于python爬取链家二手房信息代码示例

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python通过ssh-powershell监控windows的方法
Jun 02 Python
全面了解python字符串和字典
Jul 07 Python
利用python爬取斗鱼app中照片方法实例
Dec 03 Python
python实现图片识别汽车功能
Nov 30 Python
python3利用ctypes传入一个字符串类型的列表方法
Feb 12 Python
我用Python抓取了7000 多本电子书案例详解
Mar 25 Python
Python Django 实现简单注册功能过程详解
Jul 29 Python
python3连接kafka模块pykafka生产者简单封装代码
Dec 23 Python
python Popen 获取输出,等待运行完成示例
Dec 30 Python
Python实现初始化不同的变量类型为空值
Jun 02 Python
浅谈python量化 双均线策略(金叉死叉)
Jun 03 Python
pytorch中的weight-initilzation用法
Jun 24 Python
如何让PyQt5中QWebEngineView与JavaScript交互
Oct 21 #Python
Python为何不支持switch语句原理详解
Oct 21 #Python
基于Python爬取素材网站音频文件
Oct 21 #Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
You might like
IIS6.0+PHP5.x+MySQL5.x+Zend3.0x+GD+phpMyAdmin2.8x通用安装实例(已经完成)
2006/12/06 PHP
PHP求小于1000的所有水仙花数的代码
2012/01/10 PHP
PHP Class&Object -- 解析PHP实现二叉树
2013/06/25 PHP
奉献出一个封装的curl函数 便于调用(抓数据专用)
2013/07/22 PHP
php自动识别文字编码并转换为目标编码的方法
2015/08/08 PHP
关于php中的json_encode()和json_decode()函数的一些说明
2016/11/20 PHP
php设计模式之单例模式用法经典示例分析
2019/09/20 PHP
javascript 带有滚动条的表格,标题固定,带排序功能.
2009/11/13 Javascript
jQuery中[attribute*=value]选择器用法实例
2014/12/31 Javascript
在浏览器中打开或关闭JavaScript的方法
2015/06/03 Javascript
jquery实现可自动判断位置的弹出层效果代码
2015/10/12 Javascript
jquery实现定时自动轮播特效
2015/12/10 Javascript
JavaScript截取、切割字符串的技巧
2016/01/07 Javascript
Uploadify上传文件方法
2016/03/16 Javascript
easyui validatebox验证
2016/04/29 Javascript
jsTree使用记录实例
2016/12/01 Javascript
解决Vue使用mint-ui loadmore实现上拉加载与下拉刷新出现一个页面使用多个上拉加载后冲突问题
2017/11/07 Javascript
微信小程序switch组件使用详解
2018/01/31 Javascript
编写React组件项目实践分析
2018/03/04 Javascript
你点的 ES6一些小技巧,请查收
2018/04/25 Javascript
基于axios 解决跨域cookie丢失的问题
2018/09/26 Javascript
jQuery实现王者荣耀手风琴效果
2020/01/17 jQuery
jQuery+Ajax+js实现请求json格式数据并渲染到html页面操作示例
2020/06/02 jQuery
微信小程序实现下拉加载更多商品
2020/12/29 Javascript
python使用PyGame模块播放声音的方法
2015/05/20 Python
Python正规则表达式学习指南
2016/08/02 Python
对python的unittest架构公共参数token提取方法详解
2018/12/17 Python
Django 创建新App及其常用命令的实现方法
2019/08/04 Python
python 进程间数据共享multiProcess.Manger实现解析
2019/09/23 Python
python如何实现不用装饰器实现登陆器小程序
2019/12/14 Python
CSS3旋转——彩色扇子兼容firefox浏览器
2013/06/04 HTML / CSS
C和C++经典笔试题附答案解析
2014/08/18 面试题
小学新学期教师寄语
2014/01/18 职场文书
导师推荐信范文
2014/05/09 职场文书
2014年工程工作总结
2014/11/25 职场文书
个人道歉信大全
2019/04/11 职场文书