基于python爬取链家二手房信息代码示例


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel
  • time

相关模块pip安装即可

确定目标网页数据

基于python爬取链家二手房信息代码示例

哦豁,这个价格..................看到都觉得脑阔疼

通过开发者工具,可以直接找到网页返回的数据~

基于python爬取链家二手房信息代码示例
基于python爬取链家二手房信息代码示例

每一个二手房的数据,都在网页的 li 标签里面,咱们可以获取网页返回的数据,然后通过解析,就可以获取到自己想要的数据了~

获取网页数据

import requests
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

解析网页数据

import parsel
selector = parsel.Selector(response.text)
lis = selector.css('.sellListContent li')
dit = {}
for li in lis:
  title = li.css('.title a::text').get()
  dit['标题'] = title
  positionInfo = li.css('.positionInfo a::text').getall()
  info = '-'.join(positionInfo)
  dit['开发商'] = info
  houseInfo = li.css('.houseInfo::text').get()
  dit['房子信息'] = houseInfo
  followInfo = li.css('.followInfo::text').get()
  dit['发布周期'] = followInfo
  Price = li.css('.totalPrice span::text').get()
  dit['售价/万'] = Price
  unitPrice = li.css('.unitPrice span::text').get()
  dit['单价'] = unitPrice
  csv_writer.writerow(dit)
  print(dit)

基于python爬取链家二手房信息代码示例

保存数据

import csv
f = open('二手房信息.csv', mode='a', encoding='utf-8-sig', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['标题', '开发商', '房子信息', '发布周期', '售价/万', '单价'])
csv_writer.writeheader()
csv_writer.writerow(dit)
f.close()

基于python爬取链家二手房信息代码示例

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用IPython下的Net-SNMP来管理类UNIX系统的教程
Apr 15 Python
在Python中使用poplib模块收取邮件的教程
Apr 29 Python
python中matplotlib实现最小二乘法拟合的过程详解
Jul 11 Python
浅谈python日志的配置文件路径问题
Apr 28 Python
对Python中type打开文件的方式介绍
Apr 28 Python
用python实现k近邻算法的示例代码
Sep 06 Python
python 获取页面表格数据存放到csv中的方法
Dec 26 Python
PyCharm设置每行最大长度限制的方法
Jan 16 Python
Django中间件拦截未登录url实例详解
Sep 03 Python
python目标检测给图画框,bbox画到图上并保存案例
Mar 10 Python
Python常驻任务实现接收外界参数代码解析
Jul 21 Python
sklearn中的交叉验证的实现(Cross-Validation)
Feb 22 Python
如何让PyQt5中QWebEngineView与JavaScript交互
Oct 21 #Python
Python为何不支持switch语句原理详解
Oct 21 #Python
基于Python爬取素材网站音频文件
Oct 21 #Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
You might like
php5 and xml示例
2006/11/22 PHP
Yii2实现上下联动下拉框功能的方法
2016/08/10 PHP
实例讲解PHP中使用命名空间
2019/01/27 PHP
xml 与javascript结合的问题解决方法
2007/03/24 Javascript
封装好的省市地区联动控件附下载
2007/08/13 Javascript
根据一段代码浅谈Javascript闭包
2010/12/14 Javascript
js模拟点击事件实现代码
2012/11/06 Javascript
node.js不得不说的12点内容
2014/07/14 Javascript
JavaScript创建一个object对象并操作对象属性的用法
2015/03/23 Javascript
jQuery插件expander实现图片翻转特效
2015/05/21 Javascript
在页面中输出当前客户端时间javascript实例代码
2016/03/02 Javascript
jQuery中值得注意的trigger方法浅析
2016/12/12 Javascript
javascript实现table单元格点击展开隐藏效果(实例代码)
2017/04/10 Javascript
vue element中axios下载文件(后端Python)
2019/05/10 Javascript
Vue 动态路由的实现及 Springsecurity 按钮级别的权限控制
2019/09/05 Javascript
nodejs中使用archive压缩文件的实现代码
2019/11/26 NodeJs
vue tab滚动到一定高度,固定在顶部,点击tab切换不同的内容操作
2020/07/22 Javascript
Python微信公众号开发平台
2018/01/25 Python
关于Tensorflow中的tf.train.batch函数的使用
2018/04/24 Python
python实现指定字符串补全空格、前面填充0的方法
2018/11/16 Python
python等差数列求和公式前 100 项的和实例
2020/02/25 Python
Python基于yield遍历多个可迭代对象
2020/03/12 Python
用python 绘制茎叶图和复合饼图
2021/02/26 Python
python Protobuf定义消息类型知识点讲解
2021/03/02 Python
HTML5是什么 HTML5是什么意思 HTML5简介
2012/10/26 HTML / CSS
植村秀加拿大官网:Shu Uemura加拿大
2019/09/03 全球购物
加拿大品牌鞋包连锁店:Little Burgundy
2021/02/28 全球购物
AJax面试题
2014/11/25 面试题
不拖欠农民工工资承诺书
2014/03/31 职场文书
大学生优秀班干部事迹材料
2014/05/26 职场文书
2014年实习生工作总结
2014/11/27 职场文书
新娘父亲婚礼致辞
2015/07/27 职场文书
2015年社区重阳节活动总结
2015/07/30 职场文书
详解Mysql 函数调用优化
2021/04/07 MySQL
sql中mod()函数取余数的用法
2021/05/29 SQL Server
奥特曼十大神器:奥特手镯在榜,第一是贝利亚的神器
2022/03/18 日漫