基于python爬取链家二手房信息代码示例


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel
  • time

相关模块pip安装即可

确定目标网页数据

基于python爬取链家二手房信息代码示例

哦豁,这个价格..................看到都觉得脑阔疼

通过开发者工具,可以直接找到网页返回的数据~

基于python爬取链家二手房信息代码示例
基于python爬取链家二手房信息代码示例

每一个二手房的数据,都在网页的 li 标签里面,咱们可以获取网页返回的数据,然后通过解析,就可以获取到自己想要的数据了~

获取网页数据

import requests
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

解析网页数据

import parsel
selector = parsel.Selector(response.text)
lis = selector.css('.sellListContent li')
dit = {}
for li in lis:
  title = li.css('.title a::text').get()
  dit['标题'] = title
  positionInfo = li.css('.positionInfo a::text').getall()
  info = '-'.join(positionInfo)
  dit['开发商'] = info
  houseInfo = li.css('.houseInfo::text').get()
  dit['房子信息'] = houseInfo
  followInfo = li.css('.followInfo::text').get()
  dit['发布周期'] = followInfo
  Price = li.css('.totalPrice span::text').get()
  dit['售价/万'] = Price
  unitPrice = li.css('.unitPrice span::text').get()
  dit['单价'] = unitPrice
  csv_writer.writerow(dit)
  print(dit)

基于python爬取链家二手房信息代码示例

保存数据

import csv
f = open('二手房信息.csv', mode='a', encoding='utf-8-sig', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['标题', '开发商', '房子信息', '发布周期', '售价/万', '单价'])
csv_writer.writeheader()
csv_writer.writerow(dit)
f.close()

基于python爬取链家二手房信息代码示例

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python sqlobject(mysql)中文乱码解决方法
Nov 14 Python
Python多线程编程(二):启动线程的两种方法
Apr 05 Python
深入讲解Java编程中类的生命周期
Feb 05 Python
python安装twisted的问题解析
Aug 21 Python
对python遍历文件夹中的所有jpg文件的实例详解
Dec 08 Python
pyqt5 comboBox获得下标、文本和事件选中函数的方法
Jun 14 Python
Appium+python自动化之连接模拟器并启动淘宝APP(超详解)
Jun 17 Python
python 实现GUI(图形用户界面)编程详解
Jul 17 Python
python3 selenium自动化 下拉框定位的例子
Aug 23 Python
Python Flask上下文管理机制实例解析
Mar 16 Python
Django配置跨域并开发测试接口
Nov 04 Python
python正则表达式re.search()的基本使用教程
May 21 Python
如何让PyQt5中QWebEngineView与JavaScript交互
Oct 21 #Python
Python为何不支持switch语句原理详解
Oct 21 #Python
基于Python爬取素材网站音频文件
Oct 21 #Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
You might like
PHP 文件类型判断代码
2009/03/13 PHP
php Smarty模板生成html文档的方法
2010/04/12 PHP
PHP闭包实例解析
2014/09/08 PHP
PHP图片处理之图片旋转和图片翻转实例
2014/11/19 PHP
thinkphp3.x中display方法及show方法的用法实例
2016/05/19 PHP
在jQuery 1.5中使用deferred对象的代码(翻译)
2011/03/10 Javascript
Jquery中对数组的操作代码
2011/08/12 Javascript
JQUERY1.6 使用方法四 检测浏览器
2011/11/23 Javascript
JS中Iframe之间传值及子页面与父页面应用
2013/03/11 Javascript
jquery动态加载js/css文件方法(自写小函数)
2014/10/11 Javascript
浅谈js script标签中的预解析
2016/12/30 Javascript
Omi v1.0.2发布正式支持传递javascript表达式
2017/03/21 Javascript
JS中showModalDialog关闭子窗口刷新主窗口用法详解
2017/03/25 Javascript
js实现分页功能
2017/05/24 Javascript
D3.js进阶系列之CSV表格文件的读取详解
2017/06/06 Javascript
AngularJS2 与 D3.js集成实现自定义可视化的方法
2017/12/01 Javascript
angular中子控制器向父控制器传值的实例
2018/10/08 Javascript
vue中选项卡点击切换且能滑动切换功能的实现代码
2018/11/25 Javascript
Web安全之XSS攻击与防御小结
2018/12/13 Javascript
微信小程序 JS动态修改样式的实现方法
2018/12/16 Javascript
微信小程序如何引用外部js,外部样式,公共页面模板
2019/07/23 Javascript
js遍历详解(forEach, map, for, for...in, for...of)
2019/08/28 Javascript
Electron 调用命令行(cmd)
2019/09/23 Javascript
python相似模块用例
2016/03/04 Python
Python网络编程之TCP与UDP协议套接字用法示例
2018/02/02 Python
详解Django-auth-ldap 配置方法
2018/12/10 Python
打包python 加icon 去掉cmd黑窗口方法
2019/06/24 Python
如何基于python操作json文件获取内容
2019/12/24 Python
Numpy 理解ndarray对象的示例代码
2020/04/03 Python
Kent & Curwen:与大卫·贝克汉姆合作
2017/06/13 全球购物
英国天然抗衰老护肤品品牌:Nakin Skin Care
2019/04/16 全球购物
天网工程实施方案
2014/03/26 职场文书
2014院党委领导班子及其成员群众路线对照检查材料思想汇报
2014/10/04 职场文书
2015年党风廉政建设目标责任书
2015/05/08 职场文书
导游词之天津盘山
2019/11/01 职场文书
八年级作文之感恩
2019/11/22 职场文书