python 爬取免费简历模板网站的示例


Posted in Python onSeptember 27, 2020

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

爬取结果

python 爬取免费简历模板网站的示例

python 爬取免费简历模板网站的示例

以上就是python 爬取免费简历模板网站的示例的详细内容,更多关于python 爬取网站的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python基于ThreadingTCPServer创建多线程代理的方法示例
Jan 11 Python
python使用TensorFlow进行图像处理的方法
Feb 28 Python
python利用高阶函数实现剪枝函数
Mar 20 Python
利用Python进行数据可视化常见的9种方法!超实用!
Jul 11 Python
Python+pyplot绘制带文本标注的柱状图方法
Jul 08 Python
python爬虫爬取笔趣网小说网站过程图解
Nov 18 Python
Python partial函数原理及用法解析
Dec 11 Python
python利用JMeter测试Tornado的多线程
Jan 12 Python
Python利用FFT进行简单滤波的实现
Feb 26 Python
Python Django view 两种return的实现方式
Mar 16 Python
Pytorch损失函数nn.NLLLoss2d()用法说明
Jul 07 Python
Python WebSocket长连接心跳与短连接的示例
Nov 24 Python
python如何提升爬虫效率
Sep 27 #Python
python操作链表的示例代码
Sep 27 #Python
python用tkinter实现一个简易能进行随机点名的界面
Sep 27 #Python
python实现暗通道去雾算法的示例
Sep 27 #Python
谈谈python垃圾回收机制
Sep 27 #Python
如何在python中处理配置文件代码实例
Sep 27 #Python
Python 开发工具通过 agent 代理使用的方法
Sep 27 #Python
You might like
php 无限分类的树类代码
2009/12/03 PHP
phpMyadmin 用户权限中英对照
2010/04/02 PHP
phpQuery让php处理html代码像jQuery一样方便
2015/01/06 PHP
彻底搞懂PHP 变量结构体
2017/10/11 PHP
PHP反射原理与用法深入分析
2019/09/28 PHP
js前台分页显示后端JAVA数据响应
2013/03/18 Javascript
jQuery移动端日期(datedropper)和时间(timedropper)选择器附源码下载
2016/04/19 Javascript
JavaScript获取css行间样式,内连样式和外链样式的简单方法
2016/07/18 Javascript
微信小程序 图片等比例缩放(图片自适应屏幕)
2016/11/16 Javascript
javascript读取文本节点方法小结
2016/12/15 Javascript
基于vue实现swipe轮播组件实例代码
2017/05/24 Javascript
vue使用技巧及vue项目中遇到的问题
2018/06/04 Javascript
RxJS的入门指引和初步应用
2019/06/15 Javascript
利用vue-i18n实现多语言切换效果的方法
2019/06/19 Javascript
jQuery实现聊天对话框
2020/02/08 jQuery
JavaScript图片旋转效果实现方法详解
2020/06/28 Javascript
Python实现定时任务
2017/02/08 Python
JavaScript中的模拟事件和自定义事件实例分析
2018/07/27 Python
python3使用flask编写注册post接口的方法
2018/12/28 Python
python动态视频下载器的实现方法
2019/09/16 Python
python3使用GUI统计代码量
2019/09/18 Python
python文件和文件夹复制函数
2020/02/07 Python
Python文件操作及内置函数flush原理解析
2020/10/13 Python
Python经典五人分鱼实例讲解
2021/01/04 Python
HTML中使用SVG与SVG预定义形状元素介绍
2013/06/28 HTML / CSS
房产销售经理职责
2013/12/20 职场文书
大学毕业感言200字
2014/03/09 职场文书
购房协议书
2014/04/11 职场文书
培训科主任岗位职责
2014/08/08 职场文书
买卖合同协议书范本
2014/10/18 职场文书
考研复习计划
2015/01/19 职场文书
个人学习总结范文
2015/02/15 职场文书
2015年母亲节活动策划方案
2015/05/04 职场文书
python爬虫框架feapde的使用简介
2021/04/20 Python
PostgreSQL解析URL的方法
2021/08/02 PostgreSQL
Win10开机修复磁盘错误怎么跳过?Win10关闭开机磁盘检查的方法
2022/09/23 数码科技