python 爬取免费简历模板网站的示例


Posted in Python onSeptember 27, 2020

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

爬取结果

python 爬取免费简历模板网站的示例

python 爬取免费简历模板网站的示例

以上就是python 爬取免费简历模板网站的示例的详细内容,更多关于python 爬取网站的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python下10个简单实例代码
Nov 15 Python
python3读取excel文件只提取某些行某些列的值方法
Jul 10 Python
python浪漫表白源码
Apr 05 Python
Python定时任务工具之APScheduler使用方式
Jul 24 Python
python实现文件批量编码转换及注意事项
Oct 14 Python
Python 矩阵转置的几种方法小结
Dec 02 Python
python3 动态模块导入与全局变量使用实例
Dec 22 Python
python批量修改xml属性的实现方式
Mar 05 Python
详解python UDP 编程
Aug 24 Python
学习Python需要哪些工具
Sep 04 Python
Python使用openpyxl批量处理数据
Jun 23 Python
Python实现Excel文件的合并(以新冠疫情数据为例)
Mar 20 Python
python如何提升爬虫效率
Sep 27 #Python
python操作链表的示例代码
Sep 27 #Python
python用tkinter实现一个简易能进行随机点名的界面
Sep 27 #Python
python实现暗通道去雾算法的示例
Sep 27 #Python
谈谈python垃圾回收机制
Sep 27 #Python
如何在python中处理配置文件代码实例
Sep 27 #Python
Python 开发工具通过 agent 代理使用的方法
Sep 27 #Python
You might like
将PHP作为Shell脚本语言使用
2006/10/09 PHP
用PHP和ACCESS写聊天室(四)
2006/10/09 PHP
PHP设计模式之代理模式的深入解析
2013/06/13 PHP
通过javascript的匿名函数来分析几段简单有趣的代码
2010/06/29 Javascript
仿新浪微博返回顶部的jquery实现代码
2012/10/01 Javascript
javascript常用对话框小集
2013/09/13 Javascript
jQuery中offset()方法用法实例
2015/01/16 Javascript
自定义百度分享的分享按钮
2015/03/18 Javascript
Bootstrap入门书籍之(零)Bootstrap简介
2016/02/17 Javascript
JS触摸事件、手势事件详解
2017/05/04 Javascript
用nodejs实现json和jsonp服务的方法
2017/08/25 NodeJs
纯js实现隔行变色效果
2017/11/29 Javascript
详解小程序毫秒级倒计时(适用于拼团秒杀功能)
2019/05/05 Javascript
微信小程序自定义tabBar的踩坑实践记录
2020/11/06 Javascript
javascript实现简单页面倒计时
2021/03/02 Javascript
[07:03]显微镜下的DOTA2第九期——430圣堂刺客杀戮秀
2014/06/20 DOTA
Python实现修改IE注册表功能示例
2018/05/10 Python
Python编程在flask中模拟进行Restful的CRUD操作
2018/12/28 Python
对Python生成器、装饰器、递归的使用详解
2019/07/19 Python
python脚本之一键移动自定格式文件方法实例
2019/09/02 Python
python将字符串转变成dict格式的实现
2019/11/18 Python
pandas 中对特征进行硬编码和onehot编码的实现
2019/12/20 Python
使用Django xadmin 实现修改时间选择器为不可输入状态
2020/03/30 Python
QML用PathView实现轮播图
2020/06/03 Python
Python 发送邮件方法总结
2020/08/10 Python
Python测试框架:pytest学习笔记
2020/10/20 Python
世界知名接发和假发品牌:Poze Hair
2017/03/08 全球购物
Smashbox英国官网:美国知名彩妆品牌
2017/11/13 全球购物
学校门卫工作职责
2013/12/07 职场文书
小学运动会表扬稿
2014/01/19 职场文书
小学毕业典礼主持词
2014/03/27 职场文书
乡镇食品安全责任书
2014/07/28 职场文书
小学优秀教师先进事迹材料
2014/12/16 职场文书
导游词之澳门妈祖庙
2019/12/19 职场文书
Python学习之包与模块详解
2022/03/19 Python
Win10鼠标宏怎么设置?win10系统鼠标宏的设置方法
2022/08/14 数码科技