Python爬取智联招聘数据分析师岗位相关信息的方法


Posted in Python onAugust 13, 2019

进入智联招聘官网,在搜索界面输入‘数据分析师',界面跳转,按F12查看网页源码,点击network

Python爬取智联招聘数据分析师岗位相关信息的方法

 选中XHR,然后刷新网页

Python爬取智联招聘数据分析师岗位相关信息的方法

可以看到一些Ajax请求, 找到画红线的XHR文件,点击可以看到网页的一些信息

Python爬取智联招聘数据分析师岗位相关信息的方法

Python爬取智联招聘数据分析师岗位相关信息的方法

Python爬取智联招聘数据分析师岗位相关信息的方法

在Header中有Request URL,我们需要通过找寻Request URL的特点来构造这个请求网址,

点击Preview,可以看到我们所需要的信息就存在result中,这信息基本是json格式,有些是列表;

下面我们通过Python爬虫来爬取上面的信息;

代码如下:

import requests
from urllib.parse import urlencode
import json
#from requests import codes
#import os
#from hashlib import md5
#from multiprocessing.pool import Pool
#import re
 
 
def get_page(offset):
  params = {
    'start': offset,
    'pageSize': '90',
    'cityId': '530',
    'salary': '0,0',
    'workExperience': '-1',
    'education': '-1',
    'companyType': '-1',
    'employmentType': '-1',
    'jobWelfareTag': '-1',
    'kw': '数据分析师',
    'kt': '3',
    '_v': '0.77091902',
    'x-zp-page-request-id': '8ff0aa73bf834b408f46324e44d89b84-1562722989022-210101',
    'x-zp-client-id': '2dc4c9a4-e80d-4488-84a3-03426dd69a1e'
    
    
  }
  base_url = 'https://fe-api.zhaopin.com/c/i/sou?'
  url = base_url + urlencode(params)
  try:
    resp = requests.get(url)
    print(url)
    if 200 == resp.status_code:
      print(resp.json())
      return resp.json()
  except requests.ConnectionError:
    return None
 
 
def get_information(json_page):
  if json_page.get('data'):
    results = json_page.get('data').get('results')    
    for result in results:
       yield {
         'city': result.get('city').get('display'),
          'company': result.get('company').get('name'),
          #'welfare':result.get('welfare'),
          'workingExp':result.get('workingExp').get('name'),
          'salary':result.get('salary'),
          'eduLevel':result.get('eduLevel').get('name')
        }
print('succ')
 
def write_to_file(content):
   with open('result.txt','a',encoding='utf-8') as f:
      print(type(json.dumps(content)))
      f.write(json.dumps(content,ensure_ascii=False)+'\n')
   
   
def main(offset):
  json_page=get_page(offset)  
  for content in get_information(json_page):
    write_to_file(content)
  
if __name__=='__main__':
   for i in range(10):
      main(offset=90*i)

爬取结果如下:

Python爬取智联招聘数据分析师岗位相关信息的方法

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python执行时间的计算方法小结
Mar 17 Python
Python3 适合初学者学习的银行账户登录系统实例
Aug 08 Python
在Mac下使用python实现简单的目录树展示方法
Nov 01 Python
对Python 获取类的成员变量及临时变量的方法详解
Jan 22 Python
python 函数的缺省参数使用注意事项分析
Sep 17 Python
python计算波峰波谷值的方法(极值点)
Feb 18 Python
Python爬虫获取页面所有URL链接过程详解
Jun 04 Python
keras 使用Lambda 快速新建层 添加多个参数操作
Jun 10 Python
python中setuptools的作用是什么
Jun 19 Python
Python基于Socket实现简易多人聊天室的示例代码
Nov 29 Python
Python绘制K线图之可视化神器pyecharts的使用
Mar 02 Python
Python使用sql语句对mysql数据库多条件模糊查询的思路详解
Apr 12 Python
python基于json文件实现的gearman任务自动重启代码实例
Aug 13 #Python
Python 写入训练日志文件并控制台输出解析
Aug 13 #Python
基于MATLAB和Python实现MFCC特征参数提取
Aug 13 #Python
Python 使用 docopt 解析json参数文件过程讲解
Aug 13 #Python
Django项目中实现使用qq第三方登录功能
Aug 13 #Python
一篇文章搞定Python操作文件与目录
Aug 13 #Python
Python Django Cookie 简单用法解析
Aug 13 #Python
You might like
ThinkPHP实现批量删除数据的代码实例
2014/07/02 PHP
Laravel搭建后台登录系统步骤详解
2016/07/26 PHP
thinkphp3.2实现在线留言提交验证码功能
2017/07/19 PHP
THINKPHP3.2使用soap连接webservice的解决方法
2017/12/13 PHP
ThinkPHP框架整合微信支付之Native 扫码支付模式二图文详解
2019/04/09 PHP
one.php 多项目、函数库、类库 统一为一个版本的方法
2020/08/24 PHP
锋利的jQuery 要点归纳(一) jQuery选择器
2010/03/21 Javascript
javascript 多浏览器 事件大全
2010/03/23 Javascript
jQuery动态添加的元素绑定事件处理函数代码
2011/08/02 Javascript
JavaScript代码复用模式实例分析
2012/12/02 Javascript
js 数值转换为3位逗号分隔的示例代码
2014/02/19 Javascript
分享一个自己动手写的jQuery分页插件
2014/08/28 Javascript
Js控制滑轮左右滑动实例
2015/02/13 Javascript
js前端解决跨域问题的8种方案(最新最全)
2016/11/18 Javascript
基于JavaScript实现自定义滚动条
2017/01/25 Javascript
this.$toast() 了解一下?
2019/04/18 Javascript
layui 解决富文本框form表单提交为空的问题
2019/10/26 Javascript
jQuery实现计算器功能
2020/10/19 jQuery
Vue实现图书管理案例
2021/01/20 Vue.js
python实现在遍历列表时,直接对dict元素增加字段的方法
2019/01/15 Python
Django中使用session保持用户登陆连接的例子
2019/08/06 Python
python清空命令行方式
2020/01/13 Python
在tensorflow中实现去除不足一个batch的数据
2020/01/20 Python
Tensorflow 卷积的梯度反向传播过程
2020/02/10 Python
解决django框架model中外键不落实到数据库问题
2020/05/20 Python
Python使用os.listdir和os.walk获取文件路径
2020/05/21 Python
世界最大的私人旅行指南出版商:孤独星球
2016/08/23 全球购物
大学毕业通用个人的求职信
2013/12/08 职场文书
党员教师四风自我剖析材料
2014/09/30 职场文书
公司行政主管岗位职责
2015/04/09 职场文书
感动中国何玥观后感
2015/06/02 职场文书
乱世佳人观后感
2015/06/08 职场文书
国家助学金受助感言
2015/08/01 职场文书
2016党风廉政建设心得体会范文
2016/01/25 职场文书
实战 快速定位MySQL的慢SQL
2022/03/22 MySQL
Golang Web 框架Iris安装部署
2022/08/14 Python