基于python爬取链家二手房信息代码示例


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel
  • time

相关模块pip安装即可

确定目标网页数据

基于python爬取链家二手房信息代码示例

哦豁,这个价格..................看到都觉得脑阔疼

通过开发者工具,可以直接找到网页返回的数据~

基于python爬取链家二手房信息代码示例
基于python爬取链家二手房信息代码示例

每一个二手房的数据,都在网页的 li 标签里面,咱们可以获取网页返回的数据,然后通过解析,就可以获取到自己想要的数据了~

获取网页数据

import requests
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

解析网页数据

import parsel
selector = parsel.Selector(response.text)
lis = selector.css('.sellListContent li')
dit = {}
for li in lis:
  title = li.css('.title a::text').get()
  dit['标题'] = title
  positionInfo = li.css('.positionInfo a::text').getall()
  info = '-'.join(positionInfo)
  dit['开发商'] = info
  houseInfo = li.css('.houseInfo::text').get()
  dit['房子信息'] = houseInfo
  followInfo = li.css('.followInfo::text').get()
  dit['发布周期'] = followInfo
  Price = li.css('.totalPrice span::text').get()
  dit['售价/万'] = Price
  unitPrice = li.css('.unitPrice span::text').get()
  dit['单价'] = unitPrice
  csv_writer.writerow(dit)
  print(dit)

基于python爬取链家二手房信息代码示例

保存数据

import csv
f = open('二手房信息.csv', mode='a', encoding='utf-8-sig', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['标题', '开发商', '房子信息', '发布周期', '售价/万', '单价'])
csv_writer.writeheader()
csv_writer.writerow(dit)
f.close()

基于python爬取链家二手房信息代码示例

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python去除文件中空格、Tab及回车的方法
Apr 12 Python
浅谈Pandas中map, applymap and apply的区别
Apr 10 Python
python3+PyQt5实现自定义流体混合窗口部件
Apr 24 Python
详解配置Django的Celery异步之路踩坑
Nov 25 Python
python使用Paramiko模块实现远程文件拷贝
Apr 30 Python
python爬虫 爬取超清壁纸代码实例
Aug 16 Python
python 用户交互输入input的4种用法详解
Sep 24 Python
Python Django form 组件动态从数据库取choices数据实例
May 19 Python
django Model层常用验证器及自定义验证器详解
Jul 15 Python
Python通过Schema实现数据验证方式
Nov 12 Python
python 发送get请求接口详解
Nov 17 Python
在 Golang 中实现 Cache::remember 方法详解
Mar 30 Python
如何让PyQt5中QWebEngineView与JavaScript交互
Oct 21 #Python
Python为何不支持switch语句原理详解
Oct 21 #Python
基于Python爬取素材网站音频文件
Oct 21 #Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
You might like
PHP 中执行系统外部命令
2006/10/09 PHP
PHP 高手之路(一)
2006/10/09 PHP
PHP错误提示的关闭方法详解
2013/06/23 PHP
PHP超全局数组(Superglobals)介绍
2015/07/01 PHP
PHP实现时间比较和时间差计算的方法示例
2017/07/24 PHP
PHP迭代器接口Iterator用法分析
2017/12/28 PHP
PHP实现合并两个排序链表的方法
2018/01/19 PHP
PHP count()函数讲解
2019/02/03 PHP
JQuery页面的表格数据的增加与分页的实现
2013/12/10 Javascript
浅析Node在构建超媒体API中的作用
2014/07/30 Javascript
javascript动态设置样式style实例分析
2015/05/13 Javascript
基于JQuery实现仿网易邮箱全屏动感滚动插件fullPage
2015/09/20 Javascript
Kendo Grid editing 自定义验证报错提示的解决方法
2016/11/18 Javascript
微信小程序开发之录音机 音频播放 动画实例 (真机可用)
2016/12/08 Javascript
JS中Select下拉列表类(支持输入模糊查询)功能
2017/01/17 Javascript
微信小程序实现的五星评价功能示例
2019/04/25 Javascript
JS利用prototype给类添加方法操作详解
2019/06/21 Javascript
python解析xml模块封装代码
2014/02/07 Python
深入浅出学习python装饰器
2017/09/29 Python
python做量化投资系列之比特币初始配置
2018/01/23 Python
pandas or sql计算前后两行数据间的增值方法
2018/04/20 Python
使用Python进行QQ批量登录的实例代码
2018/06/11 Python
python: 判断tuple、list、dict是否为空的方法
2018/10/22 Python
Django 模型类(models.py)的定义详解
2019/07/19 Python
python利用dlib获取人脸的68个landmark
2019/11/27 Python
对python中assert、isinstance的用法详解
2019/11/27 Python
Python imutils 填充图片周边为黑色的实现
2020/01/19 Python
简单了解python列表和元组的区别
2020/05/14 Python
Python自动登录QQ的实现示例
2020/08/28 Python
解决python和pycharm安装gmpy2 出现ERROR的问题
2020/08/28 Python
幼儿园元旦亲子活动方案
2014/02/17 职场文书
节能减排倡议书
2014/04/15 职场文书
会计专业毕业生求职信
2014/07/04 职场文书
2015年政府采购工作总结
2015/05/21 职场文书
村官2015年度工作总结
2015/10/14 职场文书
2016年暑期教师培训心得体会
2016/01/09 职场文书