Python爬取智联招聘数据分析师岗位相关信息的方法


Posted in Python onAugust 13, 2019

进入智联招聘官网,在搜索界面输入‘数据分析师',界面跳转,按F12查看网页源码,点击network

Python爬取智联招聘数据分析师岗位相关信息的方法

 选中XHR,然后刷新网页

Python爬取智联招聘数据分析师岗位相关信息的方法

可以看到一些Ajax请求, 找到画红线的XHR文件,点击可以看到网页的一些信息

Python爬取智联招聘数据分析师岗位相关信息的方法

Python爬取智联招聘数据分析师岗位相关信息的方法

Python爬取智联招聘数据分析师岗位相关信息的方法

在Header中有Request URL,我们需要通过找寻Request URL的特点来构造这个请求网址,

点击Preview,可以看到我们所需要的信息就存在result中,这信息基本是json格式,有些是列表;

下面我们通过Python爬虫来爬取上面的信息;

代码如下:

import requests
from urllib.parse import urlencode
import json
#from requests import codes
#import os
#from hashlib import md5
#from multiprocessing.pool import Pool
#import re
 
 
def get_page(offset):
  params = {
    'start': offset,
    'pageSize': '90',
    'cityId': '530',
    'salary': '0,0',
    'workExperience': '-1',
    'education': '-1',
    'companyType': '-1',
    'employmentType': '-1',
    'jobWelfareTag': '-1',
    'kw': '数据分析师',
    'kt': '3',
    '_v': '0.77091902',
    'x-zp-page-request-id': '8ff0aa73bf834b408f46324e44d89b84-1562722989022-210101',
    'x-zp-client-id': '2dc4c9a4-e80d-4488-84a3-03426dd69a1e'
    
    
  }
  base_url = 'https://fe-api.zhaopin.com/c/i/sou?'
  url = base_url + urlencode(params)
  try:
    resp = requests.get(url)
    print(url)
    if 200 == resp.status_code:
      print(resp.json())
      return resp.json()
  except requests.ConnectionError:
    return None
 
 
def get_information(json_page):
  if json_page.get('data'):
    results = json_page.get('data').get('results')    
    for result in results:
       yield {
         'city': result.get('city').get('display'),
          'company': result.get('company').get('name'),
          #'welfare':result.get('welfare'),
          'workingExp':result.get('workingExp').get('name'),
          'salary':result.get('salary'),
          'eduLevel':result.get('eduLevel').get('name')
        }
print('succ')
 
def write_to_file(content):
   with open('result.txt','a',encoding='utf-8') as f:
      print(type(json.dumps(content)))
      f.write(json.dumps(content,ensure_ascii=False)+'\n')
   
   
def main(offset):
  json_page=get_page(offset)  
  for content in get_information(json_page):
    write_to_file(content)
  
if __name__=='__main__':
   for i in range(10):
      main(offset=90*i)

爬取结果如下:

Python爬取智联招聘数据分析师岗位相关信息的方法

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python简单实现子网掩码转换的方法
Apr 13 Python
Python while 循环使用的简单实例
Jun 08 Python
python数字图像处理之高级滤波代码详解
Nov 23 Python
Scrapy框架CrawlSpiders的介绍以及使用详解
Nov 29 Python
python批量修改图片大小的方法
Jul 24 Python
Python requests库用法实例详解
Aug 14 Python
使用python分析统计自己微信朋友的信息
Jul 19 Python
Python中*args和**kwargs的区别详解
Sep 17 Python
django xadmin 管理器常用显示设置方式
Mar 11 Python
解决IDEA 的 plugins 搜不到任何的插件问题
May 04 Python
浅析PyCharm 的初始设置(知道)
Oct 12 Python
Django websocket原理及功能实现代码
Nov 14 Python
python基于json文件实现的gearman任务自动重启代码实例
Aug 13 #Python
Python 写入训练日志文件并控制台输出解析
Aug 13 #Python
基于MATLAB和Python实现MFCC特征参数提取
Aug 13 #Python
Python 使用 docopt 解析json参数文件过程讲解
Aug 13 #Python
Django项目中实现使用qq第三方登录功能
Aug 13 #Python
一篇文章搞定Python操作文件与目录
Aug 13 #Python
Python Django Cookie 简单用法解析
Aug 13 #Python
You might like
PHP入门学习的几个不错的实例代码
2008/07/13 PHP
php递归实现无限分类生成下拉列表的函数
2010/08/08 PHP
保存到桌面、设为桌面且带图标的PHP代码
2013/11/19 PHP
php递归调用删除数组空值元素的方法
2015/04/28 PHP
php中青蛙跳台阶的问题解决方法
2018/10/14 PHP
网上抓的一个特效
2007/05/11 Javascript
IE innerHTML,outerHTML所引起的问题
2009/06/04 Javascript
javascript 导出数据到Excel(处理table中的元素)
2009/12/18 Javascript
JQUERY的属性选择符和自定义选择符使用方法(二)
2011/04/07 Javascript
深入理解JavaScript作用域和作用域链
2011/10/21 Javascript
js简单实现用户注册信息的校验代码
2013/11/15 Javascript
邮箱下拉自动填充选择示例代码附图
2014/04/03 Javascript
ExtJS 刷新后如何默认选中刷新前最后一次选中的节点
2014/04/03 Javascript
node.js中的console.error方法使用说明
2014/12/10 Javascript
Jquery 全选反选实例代码
2015/11/19 Javascript
JavaScript原生xmlHttp与jquery的ajax方法json数据格式实例
2015/12/04 Javascript
Fullpage.js固定导航栏-实现定位导航栏
2016/03/17 Javascript
js省市县三级联动效果实例
2020/04/15 Javascript
微信小程序 navigation API实例详解
2016/10/02 Javascript
在HTML文档中嵌入JavaScript的四种方法
2018/05/07 Javascript
JavaScript实现星级评价效果
2019/05/17 Javascript
小程序登录/注册页面设计的实现代码
2019/05/24 Javascript
在Layui中操作数据表格,给指定单元格添加事件示例
2019/10/26 Javascript
vue+webpack 更换主题N种方案优劣分析
2019/10/28 Javascript
wxpython 学习笔记 第一天
2009/02/09 Python
修改Python的pyxmpp2中的主循环使其提高性能
2015/04/24 Python
基于python的Tkinter编写登陆注册界面
2017/06/30 Python
python实现八大排序算法(1)
2017/09/14 Python
Python3.7安装keras和TensorFlow的教程图解
2020/06/18 Python
Python根据指定文件生成XML的方法
2020/06/29 Python
解决tensorflow/keras时出现数组维度不匹配问题
2020/06/29 Python
美国网上订购鲜花:FTD
2016/09/23 全球购物
修理厂厂长岗位职责
2014/01/30 职场文书
青年志愿者先进事迹
2014/05/06 职场文书
实名检举信范文
2015/03/02 职场文书
贴吧吧主申请感言
2015/08/03 职场文书