python爬虫筛选工作实例讲解


Posted in Python onNovember 23, 2020

我们在选择一件商品的时候,会先了解一些相关的商品信息,根据自己的需求和情况再进行选择。这种现象也同样适用于找工作,筛选一个岗位的重要环节,就是看自身是否符合工作经验的要求。不过因为信息量比较大,有没有什么方法可以用python爬虫中的知识点帮我们解决一下呢~具体内容往下看:

根据工作经验年限,划分招聘等级

# 校正拉勾网工作年限描述,以 Boss直聘描述为准
def update_lagou_workyear():
  items = db.jobs_lagou_php.find({})
  for item in items:
    if item['workYear'] == '应届毕业生':
      item['workYear'] = '应届生'
    elif item['workYear'] == '1年以下':
      item['workYear'] = '1年以内'
    elif item['workYear'] == '不限':
      item['workYear'] = '经验不限'
    update_lagou(item)
  print('ok')
# 设置招聘的水平,分两次执行
def set_level():
  items = db.jobs_zhipin_php.find({})
  # items = db.jobs_lagou_php.find({})
    if item['workYear'] == '应届生':
      item['level'] = 1
    elif item['workYear'] == '1年以内':
      item['level'] = 2
    elif item['workYear'] == '1-3年':
      item['level'] = 3
    elif item['workYear'] == '3-5年':
      item['level'] = 4
    elif item['workYear'] == '5-10年':
      item['level'] = 5
    elif item['workYear'] == '10年以上':
      item['level'] = 6
    elif item['workYear'] == '经验不限':
      item['level'] = 10
    update(item)
print('ok')

这里有点坑的就是,一般要求经验不限的岗位,需求基本都写在任职要求里了,所以为了统计的准确性,这个等级的数据,后面会被舍弃掉。

从后续的平均数据来看,这里的经验不限,一般要求的是1-3年左右,但是还是建议舍弃掉。

拉勾网的职位描述和 Boss直聘稍有不同,需要先校正,然后再设置等级

实例扩展:

python实现图片筛选程序

#_*_coding:utf-8_*_
'''
Version V17.1.0
Date 2017-10-15
@Author Cheney
'''

# 收集EL 图片集中需要的图片,在elpick目录下进行

from PIL import Image
import csv
import os


# 获取需要图片的文件名
def readImageName():
 # 在elpick目录下读取sn.scv文件,该文件读取出来后元素是list 需要转换为str
 get_csv = csv.reader(open("elpick/sn.csv"))
 origSN = []
 transSN = []
 for sn in get_csv:
  origSN.append(sn)
 tempList = origSN

 # 读取csv文件获时获取到的列表,其元素也是列表,需要将其转换为字符串元素,使用下面for语句实现
 for s in tempList:
  # 去掉列表元素中的[''] 这几个字符
   s = str(s).strip('[\'')
  s = str(s).strip('\']')
 transSN.append(s)
 ImageName = transSN
 return ImageName

pickImageName = readImageName()
# 遍历所有图片集的文件名
for image in os.listdir("elpick/original_el"):
 # 将读取到的文件名进行处理,去扩展名,若是int文件名需要对文件名进行int 处理
 imageName = image.strip(".jpg")

 # 比较判断 若遍历的文件名在需要收集的列表中,读取之后并保存到pick_el文件夹下
 if imageName in pickImageName:
  pickImage = Image.open(('elpick/original_el/%s.jpg') % imageName)
  pickImage.save(("elpick/picked_el/%s.jpg") % imageName)

到此这篇关于python爬虫筛选工作实例讲解的文章就介绍到这了,更多相关python爬虫筛选工作内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python检测一个对象是否为字符串类的方法
May 21 Python
django 修改server端口号的方法
May 14 Python
python求解数组中两个字符串的最小距离
Sep 27 Python
python hbase读取数据发送kafka的方法
Dec 27 Python
使用Python的networkx绘制精美网络图教程
Nov 21 Python
pytorch梯度剪裁方式
Feb 04 Python
PyQt5 如何让界面和逻辑分离的方法
Mar 24 Python
Python短信轰炸的代码
Mar 25 Python
Keras 数据增强ImageDataGenerator多输入多输出实例
Jul 03 Python
Python实现画图软件功能方法详解
Jul 28 Python
实现Python3数组旋转的3种算法实例
Sep 16 Python
Python根据字典的值查询出对应的键的方法
Sep 30 Python
python爬虫用scrapy获取影片的实例分析
Nov 23 #Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
You might like
给php新手谈谈我的学习心得
2007/02/25 PHP
程序员编程十条戒律
2009/07/09 PHP
PHP5.3的垃圾回收机制(动态存储分配方案)深入理解
2012/12/10 PHP
php反射应用示例
2014/02/25 PHP
php将字符串转化成date存入数据库的两种方式
2014/04/28 PHP
从零开始学YII2框架(一)通过Composer安装Yii2框架
2014/08/20 PHP
php自动识别文字编码并转换为目标编码的方法
2015/08/08 PHP
PHP记录页面停留时间的方法
2016/03/30 PHP
javascript十个最常用的自定义函数(中文版)
2009/09/07 Javascript
JavaScript自定义方法实现trim()、Ltrim()、Rtrim()的功能
2013/11/03 Javascript
Javascript 跨域知识详细介绍
2016/10/30 Javascript
微信小程序之ES6与事项助手的功能实现
2016/11/30 Javascript
JavaScript自执行函数和jQuery扩展方法详解
2017/10/27 jQuery
vue组件中使用iframe元素的示例代码
2017/12/13 Javascript
在vue中通过axios异步使用echarts的方法
2018/01/13 Javascript
Vue 中使用vue2-highcharts实现top功能的示例
2018/03/05 Javascript
微信小程序 调用微信授权窗口相关问题解决
2019/07/25 Javascript
Node中对非阻塞I/O、事件循环的知识点总结
2020/01/05 Javascript
[01:10]3.19DOTA2发布会 三代刀塔人第一代
2014/03/25 DOTA
Python爬虫:通过关键字爬取百度图片
2017/02/17 Python
PyQt5使用QTimer实现电子时钟
2019/07/29 Python
Django ORM判断查询结果是否为空,判断django中的orm为空实例
2020/07/09 Python
python如何快速生成时间戳
2020/07/21 Python
Python爬取豆瓣数据实现过程解析
2020/10/27 Python
python 用opencv实现霍夫线变换
2020/11/27 Python
英国著名的茶叶品牌:Whittard of Chelsea
2016/09/22 全球购物
Artist Guitars新西兰:乐器在线商店
2017/09/17 全球购物
意大利领先的线上奢侈品销售电商:Eleonora Bonucci
2017/10/17 全球购物
阿迪达斯印尼官方网站:adidas印尼
2020/02/10 全球购物
小学生操行评语大全
2014/04/22 职场文书
面试必备的求职信
2014/05/25 职场文书
幼儿老师求职信
2014/06/30 职场文书
数学兴趣小组活动总结
2014/07/08 职场文书
百善孝为先:关于孝道的经典语录
2019/10/18 职场文书
Python源码解析之List
2021/05/21 Python
如何给HttpServletRequest增加消息头
2021/06/30 Java/Android