基于python爬取链家二手房信息代码示例


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel
  • time

相关模块pip安装即可

确定目标网页数据

基于python爬取链家二手房信息代码示例

哦豁,这个价格..................看到都觉得脑阔疼

通过开发者工具,可以直接找到网页返回的数据~

基于python爬取链家二手房信息代码示例
基于python爬取链家二手房信息代码示例

每一个二手房的数据,都在网页的 li 标签里面,咱们可以获取网页返回的数据,然后通过解析,就可以获取到自己想要的数据了~

获取网页数据

import requests
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

解析网页数据

import parsel
selector = parsel.Selector(response.text)
lis = selector.css('.sellListContent li')
dit = {}
for li in lis:
  title = li.css('.title a::text').get()
  dit['标题'] = title
  positionInfo = li.css('.positionInfo a::text').getall()
  info = '-'.join(positionInfo)
  dit['开发商'] = info
  houseInfo = li.css('.houseInfo::text').get()
  dit['房子信息'] = houseInfo
  followInfo = li.css('.followInfo::text').get()
  dit['发布周期'] = followInfo
  Price = li.css('.totalPrice span::text').get()
  dit['售价/万'] = Price
  unitPrice = li.css('.unitPrice span::text').get()
  dit['单价'] = unitPrice
  csv_writer.writerow(dit)
  print(dit)

基于python爬取链家二手房信息代码示例

保存数据

import csv
f = open('二手房信息.csv', mode='a', encoding='utf-8-sig', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['标题', '开发商', '房子信息', '发布周期', '售价/万', '单价'])
csv_writer.writeheader()
csv_writer.writerow(dit)
f.close()

基于python爬取链家二手房信息代码示例

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的包和模块实例
Nov 22 Python
python实现用户登录系统
May 21 Python
对python中的pop函数和append函数详解
May 04 Python
python之django母板页面的使用
Jul 03 Python
Python3 实现文件批量重命名示例代码
Jun 03 Python
python 实现识别图片上的数字
Jul 30 Python
python实现PID算法及测试的例子
Aug 08 Python
python输出带颜色字体实例方法
Sep 01 Python
python实现通过队列完成进程间的多任务功能示例
Oct 28 Python
Python模块 _winreg操作注册表
Feb 05 Python
在python中修改.properties文件的操作
Apr 08 Python
Python Django搭建文件下载服务器的实现
May 10 Python
如何让PyQt5中QWebEngineView与JavaScript交互
Oct 21 #Python
Python为何不支持switch语句原理详解
Oct 21 #Python
基于Python爬取素材网站音频文件
Oct 21 #Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
You might like
如何正确理解PHP的错误信息
2006/10/09 PHP
特转载一高手总结PHP学习资源和链接.
2006/12/05 PHP
php学习之function的用法
2012/07/14 PHP
基于php实现随机合并数组并排序(原排序)
2015/11/26 PHP
PHP连接MSSQL方法汇总
2016/02/05 PHP
PHP制作登录异常ip检测功能的实例代码
2016/11/16 PHP
PHP+redis实现的悲观锁机制示例
2018/06/12 PHP
详解如何实现Laravel的服务容器的方法示例
2019/04/15 PHP
幻宇的层模拟窗口效果-提供演示和下载
2007/01/20 Javascript
JavaScript 解析Json字符串的性能比较分析代码
2009/12/16 Javascript
浅析XMLHttpRequest的缓存问题
2013/12/13 Javascript
jQuery中Ajax的get、post等方法详解
2015/01/20 Javascript
node-http-proxy修改响应结果实例代码
2016/06/06 Javascript
jQuery插件Easyui设置datagrid的pageNumber导致两次请求问题的解决方法
2016/08/06 Javascript
详解AngularJs路由之Ui-router-resolve(预加载)
2017/06/13 Javascript
Angular中封装fancyBox(图片预览)遇到问题小结
2017/09/01 Javascript
详解javascript常用工具类的封装
2018/01/30 Javascript
AngularJS创建一个上传照片的指令实例代码
2018/02/24 Javascript
如何在vue里添加好看的lottie动画
2018/08/02 Javascript
js指定日期增加指定月份的实现方法
2018/12/19 Javascript
vue实现后台管理权限系统及顶栏三级菜单显示功能
2019/06/19 Javascript
生成无限制的微信小程序码的示例代码
2019/09/20 Javascript
python数据结构链表之单向链表(实例讲解)
2017/07/25 Python
python打包压缩、读取指定目录下的指定类型文件
2018/04/12 Python
儿童python练习实例
2018/05/27 Python
Django 多语言教程的实现(i18n)
2018/07/07 Python
Python3数据库操作包pymysql的操作方法
2018/07/16 Python
Python3 实现文件批量重命名示例代码
2019/06/03 Python
Pyecharts绘制全球流向图的示例代码
2020/01/08 Python
IWOOT美国:新奇的小玩意
2018/04/27 全球购物
工艺员岗位职责
2014/02/11 职场文书
聚美优品励志广告词
2014/03/14 职场文书
以幸福为主题的活动方案
2014/08/22 职场文书
公司合作协议范文
2014/10/01 职场文书
MySQL开启事务的方式
2021/06/26 MySQL
JavaScript原型链中函数和对象的理解
2022/06/16 Javascript