python爬虫筛选工作实例讲解


Posted in Python onNovember 23, 2020

我们在选择一件商品的时候,会先了解一些相关的商品信息,根据自己的需求和情况再进行选择。这种现象也同样适用于找工作,筛选一个岗位的重要环节,就是看自身是否符合工作经验的要求。不过因为信息量比较大,有没有什么方法可以用python爬虫中的知识点帮我们解决一下呢~具体内容往下看:

根据工作经验年限,划分招聘等级

# 校正拉勾网工作年限描述,以 Boss直聘描述为准
def update_lagou_workyear():
  items = db.jobs_lagou_php.find({})
  for item in items:
    if item['workYear'] == '应届毕业生':
      item['workYear'] = '应届生'
    elif item['workYear'] == '1年以下':
      item['workYear'] = '1年以内'
    elif item['workYear'] == '不限':
      item['workYear'] = '经验不限'
    update_lagou(item)
  print('ok')
# 设置招聘的水平,分两次执行
def set_level():
  items = db.jobs_zhipin_php.find({})
  # items = db.jobs_lagou_php.find({})
    if item['workYear'] == '应届生':
      item['level'] = 1
    elif item['workYear'] == '1年以内':
      item['level'] = 2
    elif item['workYear'] == '1-3年':
      item['level'] = 3
    elif item['workYear'] == '3-5年':
      item['level'] = 4
    elif item['workYear'] == '5-10年':
      item['level'] = 5
    elif item['workYear'] == '10年以上':
      item['level'] = 6
    elif item['workYear'] == '经验不限':
      item['level'] = 10
    update(item)
print('ok')

这里有点坑的就是,一般要求经验不限的岗位,需求基本都写在任职要求里了,所以为了统计的准确性,这个等级的数据,后面会被舍弃掉。

从后续的平均数据来看,这里的经验不限,一般要求的是1-3年左右,但是还是建议舍弃掉。

拉勾网的职位描述和 Boss直聘稍有不同,需要先校正,然后再设置等级

实例扩展:

python实现图片筛选程序

#_*_coding:utf-8_*_
'''
Version V17.1.0
Date 2017-10-15
@Author Cheney
'''

# 收集EL 图片集中需要的图片,在elpick目录下进行

from PIL import Image
import csv
import os


# 获取需要图片的文件名
def readImageName():
 # 在elpick目录下读取sn.scv文件,该文件读取出来后元素是list 需要转换为str
 get_csv = csv.reader(open("elpick/sn.csv"))
 origSN = []
 transSN = []
 for sn in get_csv:
  origSN.append(sn)
 tempList = origSN

 # 读取csv文件获时获取到的列表,其元素也是列表,需要将其转换为字符串元素,使用下面for语句实现
 for s in tempList:
  # 去掉列表元素中的[''] 这几个字符
   s = str(s).strip('[\'')
  s = str(s).strip('\']')
 transSN.append(s)
 ImageName = transSN
 return ImageName

pickImageName = readImageName()
# 遍历所有图片集的文件名
for image in os.listdir("elpick/original_el"):
 # 将读取到的文件名进行处理,去扩展名,若是int文件名需要对文件名进行int 处理
 imageName = image.strip(".jpg")

 # 比较判断 若遍历的文件名在需要收集的列表中,读取之后并保存到pick_el文件夹下
 if imageName in pickImageName:
  pickImage = Image.open(('elpick/original_el/%s.jpg') % imageName)
  pickImage.save(("elpick/picked_el/%s.jpg") % imageName)

到此这篇关于python爬虫筛选工作实例讲解的文章就介绍到这了,更多相关python爬虫筛选工作内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
使用Python的Scrapy框架编写web爬虫的简单示例
Apr 17 Python
PyMongo安装使用笔记
Apr 27 Python
python变量不能以数字打头详解
Jul 06 Python
python脚本实现数据导出excel格式的简单方法(推荐)
Dec 30 Python
pycharm远程linux开发和调试代码的方法
Jul 17 Python
python中的tcp示例详解
Dec 09 Python
Python实现将通信达.day文件读取为DataFrame
Dec 22 Python
Python 识别12306图片验证码物品的实现示例
Jan 20 Python
解决PyCharm IDE环境下,执行unittest不生成测试报告的问题
Sep 03 Python
python操作ini类型配置文件的实例教程
Oct 30 Python
python爬虫中采集中遇到的问题整理
Nov 27 Python
Python机器学习之基于Pytorch实现猫狗分类
Jun 08 Python
python爬虫用scrapy获取影片的实例分析
Nov 23 #Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
You might like
PHP闭包实例解析
2014/09/08 PHP
thinkphp5.1框架模板赋值与变量输出示例
2020/05/25 PHP
教你如何解密js/vbs/vbscript加密的编码异处理小结
2008/06/25 Javascript
JavaScript XML操作 封装类
2009/07/01 Javascript
原生javascript获取元素样式属性值的方法
2010/12/25 Javascript
类似php的js数组的in_array函数自定义方法
2013/12/27 Javascript
解决node-webkit 不支持html5播放mp4视频的方法
2015/03/11 Javascript
两款JS脚本判断手机浏览器类型跳转WAP手机网站
2015/10/16 Javascript
Angular指令封装jQuery日期时间插件datetimepicker实现双向绑定示例
2017/01/22 Javascript
AngularJS路由实现页面跳转实例
2017/03/03 Javascript
详解Vue使用 vue-cli 搭建项目
2017/04/20 Javascript
django使用channels2.x实现实时通讯
2018/11/28 Javascript
在Vant的基础上实现添加表单验证框架的方法示例
2018/12/05 Javascript
vue文件运行的方法教学
2019/02/12 Javascript
vue实现购物车结算功能
2020/06/18 Javascript
Kettle中使用JavaScrip调用jar包对文件内容进行MD5加密的操作方法
2020/09/04 Javascript
Python找出9个连续的空闲端口
2016/02/01 Python
详解使用python的logging模块在stdout输出的两种方法
2017/05/17 Python
Python利用openpyxl库遍历Sheet的实例
2018/05/03 Python
pycharm 取消默认的右击运行unittest的方法
2018/11/29 Python
Python csv模块使用方法代码实例
2019/08/29 Python
在Python中使用turtle绘制多个同心圆示例
2019/11/23 Python
python中return的返回和执行实例
2019/12/24 Python
Python3+selenium配置常见报错解决方案
2020/08/28 Python
python raise的基本使用
2020/09/10 Python
python基于exchange函数发送邮件过程详解
2020/11/06 Python
python中count函数知识点浅析
2020/12/17 Python
英国家庭珠宝商:T. H. Baker
2018/02/08 全球购物
巴西女装购物网站:Eclectic
2018/04/24 全球购物
开学典礼主持词
2014/03/19 职场文书
农民工讨薪标语
2014/06/26 职场文书
公司开业致辞
2015/07/29 职场文书
汶川大地震感悟
2015/08/10 职场文书
python关于集合的知识案例详解
2021/05/30 Python
详解Java分布式事务的 6 种解决方案
2021/06/26 Java/Android
React如何使用axios请求数据并把数据渲染到组件
2022/08/05 Javascript