python爬虫筛选工作实例讲解


Posted in Python onNovember 23, 2020

我们在选择一件商品的时候,会先了解一些相关的商品信息,根据自己的需求和情况再进行选择。这种现象也同样适用于找工作,筛选一个岗位的重要环节,就是看自身是否符合工作经验的要求。不过因为信息量比较大,有没有什么方法可以用python爬虫中的知识点帮我们解决一下呢~具体内容往下看:

根据工作经验年限,划分招聘等级

# 校正拉勾网工作年限描述,以 Boss直聘描述为准
def update_lagou_workyear():
  items = db.jobs_lagou_php.find({})
  for item in items:
    if item['workYear'] == '应届毕业生':
      item['workYear'] = '应届生'
    elif item['workYear'] == '1年以下':
      item['workYear'] = '1年以内'
    elif item['workYear'] == '不限':
      item['workYear'] = '经验不限'
    update_lagou(item)
  print('ok')
# 设置招聘的水平,分两次执行
def set_level():
  items = db.jobs_zhipin_php.find({})
  # items = db.jobs_lagou_php.find({})
    if item['workYear'] == '应届生':
      item['level'] = 1
    elif item['workYear'] == '1年以内':
      item['level'] = 2
    elif item['workYear'] == '1-3年':
      item['level'] = 3
    elif item['workYear'] == '3-5年':
      item['level'] = 4
    elif item['workYear'] == '5-10年':
      item['level'] = 5
    elif item['workYear'] == '10年以上':
      item['level'] = 6
    elif item['workYear'] == '经验不限':
      item['level'] = 10
    update(item)
print('ok')

这里有点坑的就是,一般要求经验不限的岗位,需求基本都写在任职要求里了,所以为了统计的准确性,这个等级的数据,后面会被舍弃掉。

从后续的平均数据来看,这里的经验不限,一般要求的是1-3年左右,但是还是建议舍弃掉。

拉勾网的职位描述和 Boss直聘稍有不同,需要先校正,然后再设置等级

实例扩展:

python实现图片筛选程序

#_*_coding:utf-8_*_
'''
Version V17.1.0
Date 2017-10-15
@Author Cheney
'''

# 收集EL 图片集中需要的图片,在elpick目录下进行

from PIL import Image
import csv
import os


# 获取需要图片的文件名
def readImageName():
 # 在elpick目录下读取sn.scv文件,该文件读取出来后元素是list 需要转换为str
 get_csv = csv.reader(open("elpick/sn.csv"))
 origSN = []
 transSN = []
 for sn in get_csv:
  origSN.append(sn)
 tempList = origSN

 # 读取csv文件获时获取到的列表,其元素也是列表,需要将其转换为字符串元素,使用下面for语句实现
 for s in tempList:
  # 去掉列表元素中的[''] 这几个字符
   s = str(s).strip('[\'')
  s = str(s).strip('\']')
 transSN.append(s)
 ImageName = transSN
 return ImageName

pickImageName = readImageName()
# 遍历所有图片集的文件名
for image in os.listdir("elpick/original_el"):
 # 将读取到的文件名进行处理,去扩展名,若是int文件名需要对文件名进行int 处理
 imageName = image.strip(".jpg")

 # 比较判断 若遍历的文件名在需要收集的列表中,读取之后并保存到pick_el文件夹下
 if imageName in pickImageName:
  pickImage = Image.open(('elpick/original_el/%s.jpg') % imageName)
  pickImage.save(("elpick/picked_el/%s.jpg") % imageName)

到此这篇关于python爬虫筛选工作实例讲解的文章就介绍到这了,更多相关python爬虫筛选工作内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python使用reportlab画图示例(含中文汉字)
Dec 03 Python
Python发送Email方法实例
Aug 21 Python
Python开发SQLite3数据库相关操作详解【连接,查询,插入,更新,删除,关闭等】
Jul 27 Python
Python如何生成树形图案
Jan 03 Python
pandas pivot_table() 按日期分多列数据的方法
Nov 16 Python
python如何实现一个刷网页小程序
Nov 27 Python
python 动态生成变量名以及动态获取变量的变量名方法
Jan 20 Python
Django 对IP访问频率进行限制的例子
Aug 30 Python
python中的split()函数和os.path.split()函数使用详解
Dec 21 Python
使用Python对Dicom文件进行读取与写入的实现
Apr 20 Python
Python django框架 web端视频加密的实例详解
Nov 20 Python
python神经网络ResNet50模型
May 06 Python
python爬虫用scrapy获取影片的实例分析
Nov 23 #Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
You might like
一步一步学习PHP(1) php开发环境配置
2010/02/15 PHP
phpMyAdmin 链接表的附加功能尚未激活问题的解决方法(已测)
2012/03/27 PHP
PHP的5个安全措施小结
2012/07/17 PHP
学习php设计模式 php实现策略模式(strategy)
2015/12/07 PHP
浅谈PHP命令执行php文件需要注意的问题
2016/12/16 PHP
通过 Dom 方法提高 innerHTML 性能
2008/03/26 Javascript
jQuery数组处理代码详解(含实例演示)
2012/02/03 Javascript
ASP.NET jQuery 实例13 原创jQuery文本框字符限制插件-TextArea Counter
2012/02/03 Javascript
jquery 延迟执行实例介绍
2013/08/20 Javascript
jQuery基于当前元素进行下一步的遍历
2014/05/20 Javascript
jQuery手机拨号界面特效代码分享
2015/08/27 Javascript
在ASP.NET MVC项目中使用RequireJS库的用法示例
2016/02/15 Javascript
整理AngularJS框架使用过程当中的一些性能优化要点
2016/03/05 Javascript
关于JS中match() 和 exec() 返回值和属性的测试
2016/03/21 Javascript
javascript创建含数字字母的随机字符串方法总结
2016/08/01 Javascript
nodejs搭建本地服务器轻松解决跨域问题
2018/03/21 NodeJs
layui switch 开关监听 弹出确定状态转换的例子
2019/09/21 Javascript
vue data恢复初始化数据的实现方法
2019/10/31 Javascript
vue+ts下对axios的封装实现
2020/02/18 Javascript
使用Vue 自定义文件选择器组件的实例代码
2020/03/04 Javascript
[57:28]2018DOTA2亚洲邀请赛 4.6 淘汰赛 TNC vs Liquid 第一场
2018/04/10 DOTA
python杀死一个线程的方法
2015/09/06 Python
python自动发邮件库yagmail的示例代码
2018/02/23 Python
Python PyQt4实现QQ抽屉效果
2018/04/20 Python
Python针对给定列表中元素进行翻转操作的方法分析
2018/04/27 Python
在NumPy中创建空数组/矩阵的方法
2018/06/15 Python
python+django+rest框架配置创建方法
2019/08/31 Python
Python BeautifulReport可视化报告代码实例
2020/04/13 Python
HTML5标签小集
2011/08/02 HTML / CSS
美国半成品食材配送服务商:Home Chef
2018/01/25 全球购物
New Era英国官网:美国棒球帽品牌
2018/03/21 全球购物
国旗下的讲话演讲稿
2014/05/08 职场文书
给校长的建议书500字
2014/05/15 职场文书
人民调解员培训方案
2014/06/05 职场文书
2015年医务科工作总结范文
2015/05/26 职场文书
2016年寒假社会实践活动心得体会
2015/10/09 职场文书