编程 Python

Python爬取智联招聘数据分析师岗位相关信息的方法

Posted in Python onAugust 13, 2019

进入智联招聘官网，在搜索界面输入‘数据分析师'，界面跳转，按F12查看网页源码，点击network

选中XHR，然后刷新网页

Python爬取智联招聘数据分析师岗位相关信息的方法

可以看到一些Ajax请求，找到画红线的XHR文件，点击可以看到网页的一些信息

Python爬取智联招聘数据分析师岗位相关信息的方法

在Header中有Request URL，我们需要通过找寻Request URL的特点来构造这个请求网址，

点击Preview，可以看到我们所需要的信息就存在result中，这信息基本是json格式，有些是列表；

下面我们通过Python爬虫来爬取上面的信息；

代码如下：

import requests
from urllib.parse import urlencode
import json
#from requests import codes
#import os
#from hashlib import md5
#from multiprocessing.pool import Pool
#import re
 
 
def get_page(offset):
  params = {
    'start': offset,
    'pageSize': '90',
    'cityId': '530',
    'salary': '0,0',
    'workExperience': '-1',
    'education': '-1',
    'companyType': '-1',
    'employmentType': '-1',
    'jobWelfareTag': '-1',
    'kw': '数据分析师',
    'kt': '3',
    '_v': '0.77091902',
    'x-zp-page-request-id': '8ff0aa73bf834b408f46324e44d89b84-1562722989022-210101',
    'x-zp-client-id': '2dc4c9a4-e80d-4488-84a3-03426dd69a1e'
    
    
  }
  base_url = 'https://fe-api.zhaopin.com/c/i/sou?'
  url = base_url + urlencode(params)
  try:
    resp = requests.get(url)
    print(url)
    if 200 == resp.status_code:
      print(resp.json())
      return resp.json()
  except requests.ConnectionError:
    return None
 
 
def get_information(json_page):
  if json_page.get('data'):
    results = json_page.get('data').get('results')    
    for result in results:
       yield {
         'city': result.get('city').get('display'),
          'company': result.get('company').get('name'),
          #'welfare':result.get('welfare'),
          'workingExp':result.get('workingExp').get('name'),
          'salary':result.get('salary'),
          'eduLevel':result.get('eduLevel').get('name')
        }
print('succ')
 
def write_to_file(content):
   with open('result.txt','a',encoding='utf-8') as f:
      print(type(json.dumps(content)))
      f.write(json.dumps(content,ensure_ascii=False)+'\n')
   
   
def main(offset):
  json_page=get_page(offset)  
  for content in get_information(json_page):
    write_to_file(content)
  
if __name__=='__main__':
   for i in range(10):
      main(offset=90*i)

爬取结果如下：

Python爬取智联招聘数据分析师岗位相关信息的方法

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

Python爬取智联招聘数据分析师岗位相关信息的方法

- Author -

chuancyli

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python执行时间的计算方法小结

Mar 17 Python

Python3 适合初学者学习的银行账户登录系统实例

Aug 08 Python

在Mac下使用python实现简单的目录树展示方法

Nov 01 Python

对Python 获取类的成员变量及临时变量的方法详解

Jan 22 Python

python 函数的缺省参数使用注意事项分析

Sep 17 Python

python计算波峰波谷值的方法（极值点）

Feb 18 Python

Python爬虫获取页面所有URL链接过程详解

Jun 04 Python

keras 使用Lambda 快速新建层添加多个参数操作

Jun 10 Python

python中setuptools的作用是什么

Jun 19 Python

Python基于Socket实现简易多人聊天室的示例代码

Nov 29 Python

Python绘制K线图之可视化神器pyecharts的使用

Mar 02 Python

Python使用sql语句对mysql数据库多条件模糊查询的思路详解

Apr 12 Python

python基于json文件实现的gearman任务自动重启代码实例

Aug 13 #Python

Python 写入训练日志文件并控制台输出解析

Aug 13 #Python

基于MATLAB和Python实现MFCC特征参数提取

Aug 13 #Python

Python 使用 docopt 解析json参数文件过程讲解

Aug 13 #Python

Django项目中实现使用qq第三方登录功能

Aug 13 #Python

一篇文章搞定Python操作文件与目录

Aug 13 #Python

Python Django Cookie 简单用法解析

Aug 13 #Python

You might like

ThinkPHP实现批量删除数据的代码实例

2014/07/02 PHP

Laravel搭建后台登录系统步骤详解

2016/07/26 PHP

thinkphp3.2实现在线留言提交验证码功能

2017/07/19 PHP

THINKPHP3.2使用soap连接webservice的解决方法

2017/12/13 PHP

ThinkPHP框架整合微信支付之Native 扫码支付模式二图文详解

2019/04/09 PHP

one.php 多项目、函数库、类库统一为一个版本的方法

2020/08/24 PHP

锋利的jQuery 要点归纳（一） jQuery选择器

2010/03/21 Javascript

javascript 多浏览器事件大全

2010/03/23 Javascript

jQuery动态添加的元素绑定事件处理函数代码

2011/08/02 Javascript

JavaScript代码复用模式实例分析

2012/12/02 Javascript

js 数值转换为3位逗号分隔的示例代码

2014/02/19 Javascript

分享一个自己动手写的jQuery分页插件

2014/08/28 Javascript

Js控制滑轮左右滑动实例

2015/02/13 Javascript

js前端解决跨域问题的8种方案（最新最全）

2016/11/18 Javascript

基于JavaScript实现自定义滚动条

2017/01/25 Javascript

this.$toast() 了解一下？

2019/04/18 Javascript

layui 解决富文本框form表单提交为空的问题

2019/10/26 Javascript

jQuery实现计算器功能

2020/10/19 jQuery

Vue实现图书管理案例

2021/01/20 Vue.js

python实现在遍历列表时,直接对dict元素增加字段的方法

2019/01/15 Python

Django中使用session保持用户登陆连接的例子

2019/08/06 Python

python清空命令行方式

2020/01/13 Python

在tensorflow中实现去除不足一个batch的数据

2020/01/20 Python

Tensorflow 卷积的梯度反向传播过程

2020/02/10 Python

解决django框架model中外键不落实到数据库问题

2020/05/20 Python

Python使用os.listdir和os.walk获取文件路径

2020/05/21 Python

世界最大的私人旅行指南出版商：孤独星球

2016/08/23 全球购物

大学毕业通用个人的求职信

2013/12/08 职场文书

党员教师四风自我剖析材料

2014/09/30 职场文书

公司行政主管岗位职责

2015/04/09 职场文书

感动中国何玥观后感

2015/06/02 职场文书

乱世佳人观后感

2015/06/08 职场文书

国家助学金受助感言

2015/08/01 职场文书

2016党风廉政建设心得体会范文

2016/01/25 职场文书

实战快速定位MySQL的慢SQL

2022/03/22 MySQL

Golang Web 框架Iris安装部署

2022/08/14 Python