python爬虫筛选工作实例讲解


Posted in Python onNovember 23, 2020

我们在选择一件商品的时候,会先了解一些相关的商品信息,根据自己的需求和情况再进行选择。这种现象也同样适用于找工作,筛选一个岗位的重要环节,就是看自身是否符合工作经验的要求。不过因为信息量比较大,有没有什么方法可以用python爬虫中的知识点帮我们解决一下呢~具体内容往下看:

根据工作经验年限,划分招聘等级

# 校正拉勾网工作年限描述,以 Boss直聘描述为准
def update_lagou_workyear():
  items = db.jobs_lagou_php.find({})
  for item in items:
    if item['workYear'] == '应届毕业生':
      item['workYear'] = '应届生'
    elif item['workYear'] == '1年以下':
      item['workYear'] = '1年以内'
    elif item['workYear'] == '不限':
      item['workYear'] = '经验不限'
    update_lagou(item)
  print('ok')
# 设置招聘的水平,分两次执行
def set_level():
  items = db.jobs_zhipin_php.find({})
  # items = db.jobs_lagou_php.find({})
    if item['workYear'] == '应届生':
      item['level'] = 1
    elif item['workYear'] == '1年以内':
      item['level'] = 2
    elif item['workYear'] == '1-3年':
      item['level'] = 3
    elif item['workYear'] == '3-5年':
      item['level'] = 4
    elif item['workYear'] == '5-10年':
      item['level'] = 5
    elif item['workYear'] == '10年以上':
      item['level'] = 6
    elif item['workYear'] == '经验不限':
      item['level'] = 10
    update(item)
print('ok')

这里有点坑的就是,一般要求经验不限的岗位,需求基本都写在任职要求里了,所以为了统计的准确性,这个等级的数据,后面会被舍弃掉。

从后续的平均数据来看,这里的经验不限,一般要求的是1-3年左右,但是还是建议舍弃掉。

拉勾网的职位描述和 Boss直聘稍有不同,需要先校正,然后再设置等级

实例扩展:

python实现图片筛选程序

#_*_coding:utf-8_*_
'''
Version V17.1.0
Date 2017-10-15
@Author Cheney
'''

# 收集EL 图片集中需要的图片,在elpick目录下进行

from PIL import Image
import csv
import os


# 获取需要图片的文件名
def readImageName():
 # 在elpick目录下读取sn.scv文件,该文件读取出来后元素是list 需要转换为str
 get_csv = csv.reader(open("elpick/sn.csv"))
 origSN = []
 transSN = []
 for sn in get_csv:
  origSN.append(sn)
 tempList = origSN

 # 读取csv文件获时获取到的列表,其元素也是列表,需要将其转换为字符串元素,使用下面for语句实现
 for s in tempList:
  # 去掉列表元素中的[''] 这几个字符
   s = str(s).strip('[\'')
  s = str(s).strip('\']')
 transSN.append(s)
 ImageName = transSN
 return ImageName

pickImageName = readImageName()
# 遍历所有图片集的文件名
for image in os.listdir("elpick/original_el"):
 # 将读取到的文件名进行处理,去扩展名,若是int文件名需要对文件名进行int 处理
 imageName = image.strip(".jpg")

 # 比较判断 若遍历的文件名在需要收集的列表中,读取之后并保存到pick_el文件夹下
 if imageName in pickImageName:
  pickImage = Image.open(('elpick/original_el/%s.jpg') % imageName)
  pickImage.save(("elpick/picked_el/%s.jpg") % imageName)

到此这篇关于python爬虫筛选工作实例讲解的文章就介绍到这了,更多相关python爬虫筛选工作内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python基础教程之python消息摘要算法使用示例
Feb 10 Python
Python 40行代码实现人脸识别功能
Apr 02 Python
python批量设置多个Excel文件页眉页脚的脚本
Mar 14 Python
Python socket实现简单聊天室
Apr 01 Python
对Python中画图时候的线类型详解
Jul 07 Python
Python collections模块使用方法详解
Aug 28 Python
tensorflow实现打印ckpt模型保存下的变量名称及变量值
Jan 04 Python
python对数组进行排序,并输出排序后对应的索引值方式
Feb 28 Python
Python使用lambda抛出异常实现方法解析
Aug 20 Python
python调用win32接口进行截图的示例
Nov 11 Python
Python 使用dict实现switch的操作
Apr 07 Python
Python实现查询剪贴板自动匹配信息的思路详解
Jul 09 Python
python爬虫用scrapy获取影片的实例分析
Nov 23 #Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
You might like
php 操作excel文件的方法小结
2009/12/31 PHP
PHP的fsockopen、pfsockopen函数被主机商禁用的解决办法
2014/07/08 PHP
php操作mongoDB实例分析
2014/12/29 PHP
百度工程师讲PHP函数的实现原理及性能分析(一)
2015/05/13 PHP
PHP SPL 被遗落的宝石【SPL应用浅析】
2018/04/20 PHP
Gambit vs ForZe BO3 第一场 2.13
2021/03/10 DOTA
Js的MessageBox
2006/12/03 Javascript
JavaScript Undefined,Null类型和NaN值区别
2008/10/22 Javascript
单独使用CKFinder选择图片的方法
2010/08/21 Javascript
Js中setTimeout()和setInterval() 何时被调用执行的用法
2013/04/12 Javascript
JavaScript 模拟类机制及私有变量的方法及思路
2013/07/10 Javascript
动态的绑定事件addEventListener方法的使用
2014/01/24 Javascript
javascript 拷贝节点cloneNode()使用介绍
2014/04/03 Javascript
使用JS实现jQuery的addClass, removeClass, hasClass函数功能
2014/10/31 Javascript
jquery实现点击页面计算点击次数
2015/01/23 Javascript
JavaScript函数使用的基本教程
2015/06/04 Javascript
Vuex模块化实现待办事项的状态管理
2017/03/15 Javascript
Javascript ES6中数据类型Symbol的使用详解
2017/05/02 Javascript
JS实现经典的中国地区三级联动下拉菜单功能实例【测试可用】
2017/06/06 Javascript
解决Layui选择全部,换页checkbox复选框重新勾选的问题方法
2018/08/14 Javascript
vue 监听某个div垂直滚动条下拉到底部的方法
2018/09/15 Javascript
JavaScript 作用域实例分析
2019/10/02 Javascript
python的三目运算符和not in运算符使用示例
2014/03/03 Python
python函数装饰器用法实例详解
2015/06/04 Python
Python列表list排列组合操作示例
2018/12/18 Python
如何利用Python识别图片中的文字
2020/05/31 Python
amazeui树节点自动展开折叠面板并选中第一个树节点的实现
2020/08/24 HTML / CSS
美国户外生活方式品牌:Eddie Bauer
2016/12/28 全球购物
巴西手表购物网站:eclock
2019/03/19 全球购物
办公室文书岗位职责
2013/12/16 职场文书
网络程序员自荐信
2014/01/25 职场文书
总经理的岗位职责
2014/02/23 职场文书
医院信息公开实施方案
2014/05/09 职场文书
药房管理制度范本
2015/08/06 职场文书
《自己去吧》教学反思
2016/02/16 职场文书
python自动统计zabbix系统监控覆盖率的示例代码
2021/04/03 Python