基于python爬取链家二手房信息代码示例


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel
  • time

相关模块pip安装即可

确定目标网页数据

基于python爬取链家二手房信息代码示例

哦豁,这个价格..................看到都觉得脑阔疼

通过开发者工具,可以直接找到网页返回的数据~

基于python爬取链家二手房信息代码示例
基于python爬取链家二手房信息代码示例

每一个二手房的数据,都在网页的 li 标签里面,咱们可以获取网页返回的数据,然后通过解析,就可以获取到自己想要的数据了~

获取网页数据

import requests
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

解析网页数据

import parsel
selector = parsel.Selector(response.text)
lis = selector.css('.sellListContent li')
dit = {}
for li in lis:
  title = li.css('.title a::text').get()
  dit['标题'] = title
  positionInfo = li.css('.positionInfo a::text').getall()
  info = '-'.join(positionInfo)
  dit['开发商'] = info
  houseInfo = li.css('.houseInfo::text').get()
  dit['房子信息'] = houseInfo
  followInfo = li.css('.followInfo::text').get()
  dit['发布周期'] = followInfo
  Price = li.css('.totalPrice span::text').get()
  dit['售价/万'] = Price
  unitPrice = li.css('.unitPrice span::text').get()
  dit['单价'] = unitPrice
  csv_writer.writerow(dit)
  print(dit)

基于python爬取链家二手房信息代码示例

保存数据

import csv
f = open('二手房信息.csv', mode='a', encoding='utf-8-sig', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['标题', '开发商', '房子信息', '发布周期', '售价/万', '单价'])
csv_writer.writeheader()
csv_writer.writerow(dit)
f.close()

基于python爬取链家二手房信息代码示例

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python生成器generator用法实例分析
Jun 04 Python
Python通过正则表达式选取callback的方法
Jul 18 Python
网站渗透常用Python小脚本查询同ip网站
May 08 Python
python3大文件解压和基本操作
Dec 15 Python
django 删除数据库表后重新同步的方法
May 27 Python
Python调用服务接口的实例
Jan 03 Python
pyCharm 设置调试输出窗口中文显示方式(字符码转换)
Jun 09 Python
flask开启多线程的具体方法
Aug 02 Python
python 无损批量压缩图片(支持保留图片信息)的示例
Sep 22 Python
Python实现疫情地图可视化
Feb 05 Python
python opencv通过按键采集图片源码
May 20 Python
python 中yaml文件用法大全
Jul 04 Python
如何让PyQt5中QWebEngineView与JavaScript交互
Oct 21 #Python
Python为何不支持switch语句原理详解
Oct 21 #Python
基于Python爬取素材网站音频文件
Oct 21 #Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
You might like
xajax写的留言本
2006/11/25 PHP
Yii实现多数据库主从读写分离的方法
2014/12/29 PHP
thinkPHP微信分享接口JSSDK用法实例
2017/07/07 PHP
javascript 框架小结 个人工作经验
2009/06/13 Javascript
Jquery CheckBox全选方法代码附js checkbox全选反选代码
2010/06/09 Javascript
Prototype源码浅析 String部分(二)
2012/01/16 Javascript
页面实时更新时间的JS实例代码
2013/12/18 Javascript
jQuery中removeAttr()方法用法实例
2015/01/05 Javascript
JS实现的打字机效果完整实例
2016/06/20 Javascript
JavaScript DOM节点操作方法总结
2016/08/23 Javascript
Bootstrap CSS组件之输入框组
2016/12/17 Javascript
jQuery实现鼠标跟随效果
2017/02/20 Javascript
angularjs实现猜大小功能
2017/10/23 Javascript
JavaScript学习笔记之基于定时器实现图片无缝滚动功能详解
2019/01/09 Javascript
JavaScript剩余操作符Rest Operator详解
2019/07/20 Javascript
JavaScript的console命令使用实例
2019/12/03 Javascript
一行JavaScript代码如何实现瀑布流布局
2020/12/11 Javascript
[03:23]我的刀塔你不可能这么可爱 第一期金萌萌的故事
2014/06/20 DOTA
python中正则表达式的使用详解
2014/10/17 Python
python中的编码知识整理汇总
2016/01/26 Python
Python 通过pip安装Django详细介绍
2017/04/28 Python
python中类的输出或类的实例输出为这种形式的原因
2019/08/12 Python
python中如何实现将数据分成训练集与测试集的方法
2019/09/13 Python
python retrying模块的使用方法详解
2019/09/25 Python
让IE支持HTML5的方法
2012/12/11 HTML / CSS
浅析HTML5中的 History 模式
2017/06/22 HTML / CSS
全球最大的中文旅行网站:去哪儿网
2017/11/16 全球购物
女儿十岁生日答谢词
2014/01/27 职场文书
会计电算化应届生自荐信
2014/02/25 职场文书
大学生创业项目方案
2014/03/08 职场文书
车辆工程专业求职信
2014/06/14 职场文书
我为党旗添光彩演讲稿
2014/09/10 职场文书
贪污受贿检讨书范文
2014/11/19 职场文书
煤矿安全生产工作总结
2015/08/13 职场文书
亲情作文之母爱
2019/09/25 职场文书
python数据库批量插入数据的实现(executemany的使用)
2021/04/30 Python