python爬虫筛选工作实例讲解


Posted in Python onNovember 23, 2020

我们在选择一件商品的时候,会先了解一些相关的商品信息,根据自己的需求和情况再进行选择。这种现象也同样适用于找工作,筛选一个岗位的重要环节,就是看自身是否符合工作经验的要求。不过因为信息量比较大,有没有什么方法可以用python爬虫中的知识点帮我们解决一下呢~具体内容往下看:

根据工作经验年限,划分招聘等级

# 校正拉勾网工作年限描述,以 Boss直聘描述为准
def update_lagou_workyear():
  items = db.jobs_lagou_php.find({})
  for item in items:
    if item['workYear'] == '应届毕业生':
      item['workYear'] = '应届生'
    elif item['workYear'] == '1年以下':
      item['workYear'] = '1年以内'
    elif item['workYear'] == '不限':
      item['workYear'] = '经验不限'
    update_lagou(item)
  print('ok')
# 设置招聘的水平,分两次执行
def set_level():
  items = db.jobs_zhipin_php.find({})
  # items = db.jobs_lagou_php.find({})
    if item['workYear'] == '应届生':
      item['level'] = 1
    elif item['workYear'] == '1年以内':
      item['level'] = 2
    elif item['workYear'] == '1-3年':
      item['level'] = 3
    elif item['workYear'] == '3-5年':
      item['level'] = 4
    elif item['workYear'] == '5-10年':
      item['level'] = 5
    elif item['workYear'] == '10年以上':
      item['level'] = 6
    elif item['workYear'] == '经验不限':
      item['level'] = 10
    update(item)
print('ok')

这里有点坑的就是,一般要求经验不限的岗位,需求基本都写在任职要求里了,所以为了统计的准确性,这个等级的数据,后面会被舍弃掉。

从后续的平均数据来看,这里的经验不限,一般要求的是1-3年左右,但是还是建议舍弃掉。

拉勾网的职位描述和 Boss直聘稍有不同,需要先校正,然后再设置等级

实例扩展:

python实现图片筛选程序

#_*_coding:utf-8_*_
'''
Version V17.1.0
Date 2017-10-15
@Author Cheney
'''

# 收集EL 图片集中需要的图片,在elpick目录下进行

from PIL import Image
import csv
import os


# 获取需要图片的文件名
def readImageName():
 # 在elpick目录下读取sn.scv文件,该文件读取出来后元素是list 需要转换为str
 get_csv = csv.reader(open("elpick/sn.csv"))
 origSN = []
 transSN = []
 for sn in get_csv:
  origSN.append(sn)
 tempList = origSN

 # 读取csv文件获时获取到的列表,其元素也是列表,需要将其转换为字符串元素,使用下面for语句实现
 for s in tempList:
  # 去掉列表元素中的[''] 这几个字符
   s = str(s).strip('[\'')
  s = str(s).strip('\']')
 transSN.append(s)
 ImageName = transSN
 return ImageName

pickImageName = readImageName()
# 遍历所有图片集的文件名
for image in os.listdir("elpick/original_el"):
 # 将读取到的文件名进行处理,去扩展名,若是int文件名需要对文件名进行int 处理
 imageName = image.strip(".jpg")

 # 比较判断 若遍历的文件名在需要收集的列表中,读取之后并保存到pick_el文件夹下
 if imageName in pickImageName:
  pickImage = Image.open(('elpick/original_el/%s.jpg') % imageName)
  pickImage.save(("elpick/picked_el/%s.jpg") % imageName)

到此这篇关于python爬虫筛选工作实例讲解的文章就介绍到这了,更多相关python爬虫筛选工作内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
使用Python实现下载网易云音乐的高清MV
Mar 16 Python
python单例模式实例分析
Apr 08 Python
python3编码问题汇总
Sep 06 Python
python操作列表的函数使用代码详解
Dec 28 Python
wx.CheckBox创建复选框控件并响应鼠标点击事件
Apr 25 Python
Django跨域请求CSRF的方法示例
Nov 11 Python
python2.7实现邮件发送功能
Dec 12 Python
Python3利用print输出带颜色的彩色字体示例代码
Apr 08 Python
python二分法查找算法实现方法【递归与非递归】
Dec 06 Python
python开发入门——列表生成式
Sep 03 Python
python函数指定默认值的实例讲解
Mar 29 Python
人工智能深度学习OpenAI baselines的使用方法
May 20 Python
python爬虫用scrapy获取影片的实例分析
Nov 23 #Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
You might like
ajax java 实现自动完成功能
2012/12/19 Javascript
JavaScript初学者应注意的七个细节详细介绍
2012/12/27 Javascript
JavaScript加强之自定义callback示例
2013/09/21 Javascript
JQuery操作单选按钮以及复选按钮示例
2013/09/23 Javascript
调用DOM对象的focus使文本框获得焦点
2014/02/19 Javascript
JS按回车键实现登录的方法
2014/08/25 Javascript
jQuery中wrapInner()方法用法实例
2015/01/16 Javascript
Angularjs基础知识及示例汇总
2015/01/22 Javascript
原生js实现类似弹窗抖动效果
2015/04/02 Javascript
Hallo.js基于jQuery UI所见即所得的Web编辑器
2016/01/26 Javascript
js实现ctrl+v粘贴上传图片(兼容chrome、firefox、ie11)
2016/03/09 Javascript
AngularJS入门教程之表格实例详解
2016/07/27 Javascript
jQuery ajax请求struts action实现异步刷新
2017/04/19 jQuery
利用babel将es6语法转es5的简单示例
2017/12/01 Javascript
Vue 页面切换效果之 BubbleTransition(推荐)
2018/04/08 Javascript
layui-laydate时间日历控件使用方法详解
2018/11/15 Javascript
使用python BeautifulSoup库抓取58手机维修信息
2013/11/21 Python
python 简单备份文件脚本v1.0的实例
2017/11/06 Python
Python实现桶排序与快速排序算法结合应用示例
2017/11/22 Python
python中dict字典的查询键值对 遍历 排序 创建 访问 更新 删除基础操作方法
2018/09/13 Python
使用Python获取网段IP个数以及地址清单的方法
2018/11/01 Python
python使用opencv在Windows下调用摄像头实现解析
2019/11/26 Python
python orm 框架中sqlalchemy用法实例详解
2020/02/02 Python
is_file和file_exists效率比较
2021/03/14 PHP
css3动画鼠标放上图片逐渐变大鼠标离开图片逐渐缩小效果
2021/01/27 HTML / CSS
html5时钟实现代码
2010/10/22 HTML / CSS
意大利在线大学图书馆:Libreria universitaria
2019/07/16 全球购物
公司联欢会策划方案
2014/05/19 职场文书
节约能源标语
2014/06/17 职场文书
家具商场的活动方案
2014/08/16 职场文书
夫妻忠诚协议范文
2014/11/16 职场文书
2015年元旦文艺晚会总结(学院)
2014/11/28 职场文书
法律意见书范本
2015/06/04 职场文书
2015年街道办事处团委工作总结
2015/10/14 职场文书
详解nodejs内置模块
2021/05/06 NodeJs
html网页引入svg图片的4种方式
2022/08/05 HTML / CSS