python爬虫筛选工作实例讲解


Posted in Python onNovember 23, 2020

我们在选择一件商品的时候,会先了解一些相关的商品信息,根据自己的需求和情况再进行选择。这种现象也同样适用于找工作,筛选一个岗位的重要环节,就是看自身是否符合工作经验的要求。不过因为信息量比较大,有没有什么方法可以用python爬虫中的知识点帮我们解决一下呢~具体内容往下看:

根据工作经验年限,划分招聘等级

# 校正拉勾网工作年限描述,以 Boss直聘描述为准
def update_lagou_workyear():
  items = db.jobs_lagou_php.find({})
  for item in items:
    if item['workYear'] == '应届毕业生':
      item['workYear'] = '应届生'
    elif item['workYear'] == '1年以下':
      item['workYear'] = '1年以内'
    elif item['workYear'] == '不限':
      item['workYear'] = '经验不限'
    update_lagou(item)
  print('ok')
# 设置招聘的水平,分两次执行
def set_level():
  items = db.jobs_zhipin_php.find({})
  # items = db.jobs_lagou_php.find({})
    if item['workYear'] == '应届生':
      item['level'] = 1
    elif item['workYear'] == '1年以内':
      item['level'] = 2
    elif item['workYear'] == '1-3年':
      item['level'] = 3
    elif item['workYear'] == '3-5年':
      item['level'] = 4
    elif item['workYear'] == '5-10年':
      item['level'] = 5
    elif item['workYear'] == '10年以上':
      item['level'] = 6
    elif item['workYear'] == '经验不限':
      item['level'] = 10
    update(item)
print('ok')

这里有点坑的就是,一般要求经验不限的岗位,需求基本都写在任职要求里了,所以为了统计的准确性,这个等级的数据,后面会被舍弃掉。

从后续的平均数据来看,这里的经验不限,一般要求的是1-3年左右,但是还是建议舍弃掉。

拉勾网的职位描述和 Boss直聘稍有不同,需要先校正,然后再设置等级

实例扩展:

python实现图片筛选程序

#_*_coding:utf-8_*_
'''
Version V17.1.0
Date 2017-10-15
@Author Cheney
'''

# 收集EL 图片集中需要的图片,在elpick目录下进行

from PIL import Image
import csv
import os


# 获取需要图片的文件名
def readImageName():
 # 在elpick目录下读取sn.scv文件,该文件读取出来后元素是list 需要转换为str
 get_csv = csv.reader(open("elpick/sn.csv"))
 origSN = []
 transSN = []
 for sn in get_csv:
  origSN.append(sn)
 tempList = origSN

 # 读取csv文件获时获取到的列表,其元素也是列表,需要将其转换为字符串元素,使用下面for语句实现
 for s in tempList:
  # 去掉列表元素中的[''] 这几个字符
   s = str(s).strip('[\'')
  s = str(s).strip('\']')
 transSN.append(s)
 ImageName = transSN
 return ImageName

pickImageName = readImageName()
# 遍历所有图片集的文件名
for image in os.listdir("elpick/original_el"):
 # 将读取到的文件名进行处理,去扩展名,若是int文件名需要对文件名进行int 处理
 imageName = image.strip(".jpg")

 # 比较判断 若遍历的文件名在需要收集的列表中,读取之后并保存到pick_el文件夹下
 if imageName in pickImageName:
  pickImage = Image.open(('elpick/original_el/%s.jpg') % imageName)
  pickImage.save(("elpick/picked_el/%s.jpg") % imageName)

到此这篇关于python爬虫筛选工作实例讲解的文章就介绍到这了,更多相关python爬虫筛选工作内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中optionParser模块的使用方法实例教程
Aug 29 Python
Python统计文件中去重后uuid个数的方法
Jul 30 Python
Python入门之三角函数全解【收藏】
Nov 08 Python
基于Pandas读取csv文件Error的总结
Jun 15 Python
python实现点对点聊天程序
Jul 28 Python
pandas使用apply多列生成一列数据的实例
Nov 28 Python
numpy concatenate数组拼接方法示例介绍
May 27 Python
500行Python代码打造刷脸考勤系统
Jun 03 Python
Python3读写Excel文件(使用xlrd,xlsxwriter,openpyxl3种方式读写实例与优劣)
Feb 13 Python
python 判断txt每行内容中是否包含子串并重新写入保存的实例
Mar 12 Python
Python __slots__的使用方法
Nov 15 Python
实例讲解Python中sys.argv[]的用法
Jun 03 Python
python爬虫用scrapy获取影片的实例分析
Nov 23 #Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
You might like
什么是短波收听SWL
2021/03/01 无线电
那些年一起学习的PHP(二)
2012/03/21 PHP
PHP Warning: Module 'modulename' already loaded in问题解决办法
2015/03/16 PHP
jquery form表单提交插件asp.net后台中文解码
2010/06/12 Javascript
autoPlay 基于jquery的图片自动播放效果
2011/12/07 Javascript
js单例模式的两种方案
2013/10/22 Javascript
浅谈javascript中createElement事件
2014/12/05 Javascript
node.js中的fs.fchown方法使用说明
2014/12/16 Javascript
JavaScript的面向对象编程基础
2015/08/13 Javascript
jquery按回车键实现表单提交的简单实例
2016/05/25 Javascript
vue2.0+vuex+localStorage代办事项应用实现详解
2018/05/31 Javascript
JS内部事件机制之单线程原理
2018/07/02 Javascript
微信小程序wx.request的简单封装
2019/11/13 Javascript
Node.js API详解之 dgram模块用法实例分析
2020/06/05 Javascript
JS forEach跳出循环2种实现方法
2020/06/24 Javascript
[02:04]完美世界城市挑战赛秋季赛报名开始 谁是solo路人王?
2019/10/10 DOTA
python使用PythonMagick将jpg图片转换成ico图片的方法
2015/03/26 Python
Python中的字符串类型基本知识学习教程
2016/02/04 Python
利用Python自带PIL库扩展图片大小给图片加文字描述的方法示例
2017/08/08 Python
动态规划之矩阵连乘问题Python实现方法
2017/11/27 Python
完美解决在oj中Python的循环输入问题
2018/06/25 Python
opencv python 傅里叶变换的使用
2018/07/21 Python
Python爬虫框架Scrapy基本用法入门教程
2018/07/26 Python
解决Pytorch自定义层出现多Variable共享内存错误问题
2020/06/28 Python
美国知名玩具品牌:Melissa & Doug
2016/08/16 全球购物
GNC健安喜官方海外旗舰店:美国著名保健品牌
2017/01/04 全球购物
英国领先的电子、技术和办公用品购物网站:Ebuyer
2018/04/04 全球购物
护士自我鉴定怎么写
2014/02/07 职场文书
竞选部门副经理的自荐书范文
2014/02/11 职场文书
2014年党务公开实施方案
2014/02/27 职场文书
机电一体化应届生求职信
2014/08/09 职场文书
大学学生个人总结
2015/02/15 职场文书
Vue.js 带下拉选项的输入框(Textbox with Dropdown)组件
2021/04/17 Vue.js
十个Python自动化常用操作,即拿即用
2021/05/10 Python
Java基于Dijkstra算法实现校园导游程序
2022/03/17 Java/Android
Web应用开发TypeScript使用详解
2022/05/25 Javascript