python爬虫筛选工作实例讲解


Posted in Python onNovember 23, 2020

我们在选择一件商品的时候,会先了解一些相关的商品信息,根据自己的需求和情况再进行选择。这种现象也同样适用于找工作,筛选一个岗位的重要环节,就是看自身是否符合工作经验的要求。不过因为信息量比较大,有没有什么方法可以用python爬虫中的知识点帮我们解决一下呢~具体内容往下看:

根据工作经验年限,划分招聘等级

# 校正拉勾网工作年限描述,以 Boss直聘描述为准
def update_lagou_workyear():
  items = db.jobs_lagou_php.find({})
  for item in items:
    if item['workYear'] == '应届毕业生':
      item['workYear'] = '应届生'
    elif item['workYear'] == '1年以下':
      item['workYear'] = '1年以内'
    elif item['workYear'] == '不限':
      item['workYear'] = '经验不限'
    update_lagou(item)
  print('ok')
# 设置招聘的水平,分两次执行
def set_level():
  items = db.jobs_zhipin_php.find({})
  # items = db.jobs_lagou_php.find({})
    if item['workYear'] == '应届生':
      item['level'] = 1
    elif item['workYear'] == '1年以内':
      item['level'] = 2
    elif item['workYear'] == '1-3年':
      item['level'] = 3
    elif item['workYear'] == '3-5年':
      item['level'] = 4
    elif item['workYear'] == '5-10年':
      item['level'] = 5
    elif item['workYear'] == '10年以上':
      item['level'] = 6
    elif item['workYear'] == '经验不限':
      item['level'] = 10
    update(item)
print('ok')

这里有点坑的就是,一般要求经验不限的岗位,需求基本都写在任职要求里了,所以为了统计的准确性,这个等级的数据,后面会被舍弃掉。

从后续的平均数据来看,这里的经验不限,一般要求的是1-3年左右,但是还是建议舍弃掉。

拉勾网的职位描述和 Boss直聘稍有不同,需要先校正,然后再设置等级

实例扩展:

python实现图片筛选程序

#_*_coding:utf-8_*_
'''
Version V17.1.0
Date 2017-10-15
@Author Cheney
'''

# 收集EL 图片集中需要的图片,在elpick目录下进行

from PIL import Image
import csv
import os


# 获取需要图片的文件名
def readImageName():
 # 在elpick目录下读取sn.scv文件,该文件读取出来后元素是list 需要转换为str
 get_csv = csv.reader(open("elpick/sn.csv"))
 origSN = []
 transSN = []
 for sn in get_csv:
  origSN.append(sn)
 tempList = origSN

 # 读取csv文件获时获取到的列表,其元素也是列表,需要将其转换为字符串元素,使用下面for语句实现
 for s in tempList:
  # 去掉列表元素中的[''] 这几个字符
   s = str(s).strip('[\'')
  s = str(s).strip('\']')
 transSN.append(s)
 ImageName = transSN
 return ImageName

pickImageName = readImageName()
# 遍历所有图片集的文件名
for image in os.listdir("elpick/original_el"):
 # 将读取到的文件名进行处理,去扩展名,若是int文件名需要对文件名进行int 处理
 imageName = image.strip(".jpg")

 # 比较判断 若遍历的文件名在需要收集的列表中,读取之后并保存到pick_el文件夹下
 if imageName in pickImageName:
  pickImage = Image.open(('elpick/original_el/%s.jpg') % imageName)
  pickImage.save(("elpick/picked_el/%s.jpg") % imageName)

到此这篇关于python爬虫筛选工作实例讲解的文章就介绍到这了,更多相关python爬虫筛选工作内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python 布尔操作实现代码
Mar 23 Python
在Django的模型和公用函数中使用惰性翻译对象
Jul 27 Python
Python实现简单字典树的方法
Apr 29 Python
修复 Django migration 时遇到的问题解决
Jun 14 Python
python开发之anaconda以及win7下安装gensim的方法
Jul 05 Python
python增加图像对比度的方法
Jul 12 Python
详细介绍pandas的DataFrame的append方法使用
Jul 31 Python
python3使用print打印带颜色的字符串代码实例
Aug 22 Python
python_mask_array的用法
Feb 18 Python
如何配置关联Python 解释器 Anaconda的教程(图解)
Apr 30 Python
sklearn和keras的数据切分与交叉验证的实例详解
Jun 19 Python
Python定时任务APScheduler安装及使用解析
Aug 07 Python
python爬虫用scrapy获取影片的实例分析
Nov 23 #Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
You might like
PHP 读取文件的正确方法
2009/04/29 PHP
php基础教程 php内置函数实例教程
2012/08/21 PHP
ThinkPHP实现带验证码的文件上传功能实例
2014/11/01 PHP
详解php命令注入攻击
2019/04/06 PHP
详解提高使用Java反射的效率方法
2019/04/29 PHP
laravel接管Dingo-api和默认的错误处理方式
2019/10/25 PHP
JavaScript 不只是脚本
2007/05/30 Javascript
不懂JavaScript应该怎样学
2008/04/16 Javascript
IE php关于强制下载文件的代码
2008/08/23 Javascript
利用javascript解决图片缩放及其优化的代码
2012/05/23 Javascript
Jquery仿淘宝京东多条件筛选可自行结合ajax加载示例
2013/08/28 Javascript
jQuery实现自定义右键菜单的树状菜单效果
2015/09/02 Javascript
SpringMVC框架下JQuery传递并解析Json格式的数据是如何实现的
2015/12/10 Javascript
基于javascript实现tab选项卡切换特效调试笔记
2016/03/30 Javascript
vue货币过滤器的实现方法
2017/04/01 Javascript
原生JS实现$.param() 函数的方法
2018/08/10 Javascript
Vuex 使用及简单实例(计数器)
2018/08/29 Javascript
如何使用CSS3+JQuery实现悬浮墙式菜单
2019/06/18 jQuery
通过实例解析vuejs如何实现调试代码
2020/07/16 Javascript
vue 解决IOS10低版本白屏的问题
2020/11/17 Javascript
[03:17]2014DOTA2 国际邀请赛中国区预选赛 四强专访
2014/05/23 DOTA
python实现反转部分单向链表
2018/09/27 Python
解决python 自动安装缺少模块的问题
2018/10/22 Python
python实现nao机器人身体躯干和腿部动作操作
2019/04/29 Python
CSS3中的弹性布局em运用入门详解 1em等于多少像素
2021/02/08 HTML / CSS
倩碧美国官网:Clinique美国
2016/07/20 全球购物
药学专业大学生个人的自我评价
2013/11/04 职场文书
天鹅的故事教学反思
2014/02/04 职场文书
百年校庆节目主持词
2014/03/27 职场文书
小小商店教学反思
2014/04/27 职场文书
2015年12.4全国法制宣传日活动总结
2015/03/24 职场文书
婚庆司仪开场白
2015/05/29 职场文书
python munch库的使用解析
2021/05/25 Python
Java并发编程之详解CyclicBarrier线程同步
2021/06/23 Java/Android
解决vue中provide inject的响应式监听
2022/04/19 Vue.js
Spring中bean集合注入的方法详解
2022/07/07 Java/Android