基于python爬取链家二手房信息代码示例


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel
  • time

相关模块pip安装即可

确定目标网页数据

基于python爬取链家二手房信息代码示例

哦豁,这个价格..................看到都觉得脑阔疼

通过开发者工具,可以直接找到网页返回的数据~

基于python爬取链家二手房信息代码示例
基于python爬取链家二手房信息代码示例

每一个二手房的数据,都在网页的 li 标签里面,咱们可以获取网页返回的数据,然后通过解析,就可以获取到自己想要的数据了~

获取网页数据

import requests
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

解析网页数据

import parsel
selector = parsel.Selector(response.text)
lis = selector.css('.sellListContent li')
dit = {}
for li in lis:
  title = li.css('.title a::text').get()
  dit['标题'] = title
  positionInfo = li.css('.positionInfo a::text').getall()
  info = '-'.join(positionInfo)
  dit['开发商'] = info
  houseInfo = li.css('.houseInfo::text').get()
  dit['房子信息'] = houseInfo
  followInfo = li.css('.followInfo::text').get()
  dit['发布周期'] = followInfo
  Price = li.css('.totalPrice span::text').get()
  dit['售价/万'] = Price
  unitPrice = li.css('.unitPrice span::text').get()
  dit['单价'] = unitPrice
  csv_writer.writerow(dit)
  print(dit)

基于python爬取链家二手房信息代码示例

保存数据

import csv
f = open('二手房信息.csv', mode='a', encoding='utf-8-sig', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['标题', '开发商', '房子信息', '发布周期', '售价/万', '单价'])
csv_writer.writeheader()
csv_writer.writerow(dit)
f.close()

基于python爬取链家二手房信息代码示例

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用Python中的greenlet包实现并发编程的入门教程
Apr 16 Python
转换科学计数法的数值字符串为decimal类型的方法
Jul 16 Python
Tensorflow使用支持向量机拟合线性回归
Sep 07 Python
python SVM 线性分类模型的实现
Jul 19 Python
Python模拟登录之滑块验证码的破解(实例代码)
Nov 18 Python
python通过opencv实现图片裁剪原理解析
Jan 19 Python
python数据库操作mysql:pymysql、sqlalchemy常见用法详解
Mar 30 Python
Python flask框架实现浏览器点击自定义跳转页面
Jun 04 Python
python+selenium 简易地疫情信息自动打卡签到功能的实现代码
Aug 22 Python
python批量提取图片信息并保存的实现
Feb 05 Python
python爬取股票最新数据并用excel绘制树状图的示例
Mar 01 Python
Python实现位图分割的效果
Nov 20 Python
如何让PyQt5中QWebEngineView与JavaScript交互
Oct 21 #Python
Python为何不支持switch语句原理详解
Oct 21 #Python
基于Python爬取素材网站音频文件
Oct 21 #Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
You might like
php && 逻辑与运算符使用说明
2010/03/04 PHP
用JavaScript仿PS里的羽化效果代码
2011/12/20 Javascript
js时间日期和毫秒的相互转换
2013/02/22 Javascript
.net,js捕捉文本框回车键事件的小例子(兼容多浏览器)
2013/03/11 Javascript
删除javascript中注释语句的正则表达式
2014/06/11 Javascript
jQuery源码分析之jQuery中的循环技巧详解
2014/09/06 Javascript
jQuery中closest()函数用法实例
2015/01/07 Javascript
JS动态加载当前时间的方法
2015/02/09 Javascript
js阻止冒泡和默认事件(默认行为)详解
2016/10/20 Javascript
axios中cookie跨域及相关配置示例详解
2017/12/20 Javascript
AngularJS实现动态切换样式的方法分析
2018/06/26 Javascript
Vue监听页面刷新和关闭功能
2019/06/20 Javascript
浅谈layui 绑定form submit提交表单的注意事项
2019/10/25 Javascript
[00:36]DOTA2风云人物相约完美“圣”典 12月17日不见不散
2016/11/30 DOTA
更改Python命令行交互提示符的方法
2015/01/14 Python
Linux 下 Python 实现按任意键退出的实现方法
2016/09/25 Python
Python学习教程之常用的内置函数大全
2017/07/14 Python
Python爬虫实战:分析《战狼2》豆瓣影评
2018/03/26 Python
扩展Django admin的list_filter()可使用范围方法
2019/08/21 Python
pytorch dataloader 取batch_size时候出现bug的解决方式
2020/02/20 Python
Python图像处理库PIL的ImageDraw模块介绍详解
2020/02/26 Python
使用python的turtle函数绘制一个滑稽表情
2020/02/28 Python
浅谈CSS3 动画卡顿解决方案
2019/01/02 HTML / CSS
浅谈html5之sse服务器发送事件EventSource介绍
2017/08/28 HTML / CSS
Html5 Canvas动画基础碰撞检测的实现
2018/12/06 HTML / CSS
ALLSAINTS英国官网:伦敦新锐潮流品牌
2016/09/19 全球购物
婚礼新郎父母答谢词
2014/01/16 职场文书
上班打牌检讨书
2014/02/07 职场文书
《雾凇》教学反思
2014/02/17 职场文书
公关活动策划方案
2014/05/25 职场文书
我的梦想演讲稿500字
2014/08/21 职场文书
委托书的写法
2014/08/30 职场文书
2014年出纳工作总结与计划
2014/12/09 职场文书
2015年国庆节广播稿
2015/08/19 职场文书
Python基础知识之变量的详解
2021/04/14 Python
一篇文章带你复习java知识点
2021/06/28 Java/Android