python 爬取免费简历模板网站的示例


Posted in Python onSeptember 27, 2020

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

爬取结果

python 爬取免费简历模板网站的示例

python 爬取免费简历模板网站的示例

以上就是python 爬取免费简历模板网站的示例的详细内容,更多关于python 爬取网站的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python装饰器的函数式编程详解
Feb 27 Python
python根据出生日期返回年龄的方法
Mar 26 Python
Python模块文件结构代码详解
Feb 03 Python
Python docx库用法示例分析
Feb 16 Python
python TF-IDF算法实现文本关键词提取
May 29 Python
python tkinter实现彩球碰撞屏保
Jul 30 Python
解决Django 在ForeignKey中出现 non-nullable field错误的问题
Aug 06 Python
python实现证件照换底功能
Aug 20 Python
python字典setdefault方法和get方法使用实例
Dec 25 Python
python GUI库图形界面开发之PyQt5树形结构控件QTreeWidget详细使用方法与实例
Mar 02 Python
Python类绑定方法及非绑定方法实例解析
Oct 09 Python
68行Python代码实现带难度升级的贪吃蛇
Jan 18 Python
python如何提升爬虫效率
Sep 27 #Python
python操作链表的示例代码
Sep 27 #Python
python用tkinter实现一个简易能进行随机点名的界面
Sep 27 #Python
python实现暗通道去雾算法的示例
Sep 27 #Python
谈谈python垃圾回收机制
Sep 27 #Python
如何在python中处理配置文件代码实例
Sep 27 #Python
Python 开发工具通过 agent 代理使用的方法
Sep 27 #Python
You might like
模仿OSO的论坛(四)
2006/10/09 PHP
IIS6.0 开启Gzip方法及PHP Gzip函数分享
2014/06/08 PHP
php使用GD创建保持宽高比缩略图的方法
2015/04/17 PHP
thinkphp5 框架结合plupload实现图片批量上传功能示例
2020/04/04 PHP
JS查看对象功能代码
2008/04/25 Javascript
ExtJS 下拉多选框lovcombo
2010/05/19 Javascript
JS基于myFocus库实现各种功能的tab选项卡切换效果
2015/09/19 Javascript
聊一聊jQuery插件uploadify使用方法
2016/08/24 Javascript
原生js实现放大镜效果
2017/01/11 Javascript
使用JS判断页面是首次被加载还是刷新
2019/05/26 Javascript
vue keep-alive实现多组件嵌套中个别组件存活不销毁的操作
2020/10/30 Javascript
[00:48]完美“圣”典2016风云人物:xiao8宣传片
2016/11/30 DOTA
[48:37]EG vs OG 2018国际邀请赛小组赛BO2 第一场 8.17
2018/08/18 DOTA
python访问纯真IP数据库的代码
2011/05/19 Python
Python自定义scrapy中间模块避免重复采集的方法
2015/04/07 Python
Python学习小技巧之列表项的拼接
2017/05/20 Python
Python中标准库OS的常用方法总结大全
2017/07/19 Python
在Python中使用defaultdict初始化字典以及应用方法
2018/10/31 Python
python绘制简单彩虹图
2018/11/19 Python
python实现批量nii文件转换为png图像
2019/07/18 Python
python用类实现文章敏感词的过滤方法示例
2019/10/27 Python
使用Pyhton集合set()实现成果查漏的例子
2019/11/24 Python
python脚本后台执行方式
2019/12/21 Python
在tensorflow中实现去除不足一个batch的数据
2020/01/20 Python
自定义Django默认的sitemap站点地图样式
2020/03/04 Python
python调用摄像头的示例代码
2020/09/28 Python
Python监听键盘和鼠标事件的示例代码
2020/11/18 Python
Python 实现PS滤镜中的径向模糊特效
2020/12/03 Python
使用Python封装excel操作指南
2021/01/29 Python
Theory美国官网:后现代都市风时装品牌
2018/05/09 全球购物
德语专业求职信
2014/03/12 职场文书
3分钟英语演讲稿
2014/04/29 职场文书
领导班子群众路线与四风问题对照检查材料思想汇报
2014/10/11 职场文书
运动会闭幕词
2015/01/28 职场文书
宝宝满月宴答谢词
2015/09/30 职场文书
分析SQL窗口函数之排名窗口函数
2022/04/21 Oracle