python 爬取免费简历模板网站的示例


Posted in Python onSeptember 27, 2020

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

爬取结果

python 爬取免费简历模板网站的示例

python 爬取免费简历模板网站的示例

以上就是python 爬取免费简历模板网站的示例的详细内容,更多关于python 爬取网站的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python实现在目录中查找指定文件的方法
Nov 11 Python
编写Python脚本抓取网络小说来制作自己的阅读器
Aug 20 Python
PYTHON压平嵌套列表的简单实现
Jun 08 Python
Django自定义分页与bootstrap分页结合
Feb 22 Python
python实现在pandas.DataFrame添加一行
Apr 04 Python
python pandas 组内排序、单组排序、标号的实例
Apr 12 Python
对Python中内置异常层次结构详解
Oct 18 Python
pandas数据集的端到端处理
Feb 18 Python
记录Python脚本的运行日志的方法
Jun 05 Python
使用Python实现图像标记点的坐标输出功能
Aug 14 Python
Python打印特殊符号及对应编码解析
May 07 Python
使用pytorch实现论文中的unet网络
Jun 24 Python
python如何提升爬虫效率
Sep 27 #Python
python操作链表的示例代码
Sep 27 #Python
python用tkinter实现一个简易能进行随机点名的界面
Sep 27 #Python
python实现暗通道去雾算法的示例
Sep 27 #Python
谈谈python垃圾回收机制
Sep 27 #Python
如何在python中处理配置文件代码实例
Sep 27 #Python
Python 开发工具通过 agent 代理使用的方法
Sep 27 #Python
You might like
php读取富文本的时p标签会出现红线是怎么回事
2014/05/13 PHP
PHP+javascript制作带提示的验证码源码分享
2014/05/28 PHP
解析PHP强制转换类型及远程管理插件的安全隐患
2014/06/30 PHP
php文件下载处理方法分析
2015/04/22 PHP
javascript 对象的定义方法
2007/01/10 Javascript
ASP.NET jQuery 实例18 通过使用jQuery validation插件校验DropDownList
2012/02/03 Javascript
JavaScript中的函数的两种定义方式和函数变量赋值
2014/05/12 Javascript
Javascript基础教程之数组 array
2015/01/18 Javascript
JavaScript Sort 的一个错误用法示例
2015/03/20 Javascript
两款JS脚本判断手机浏览器类型跳转WAP手机网站
2015/10/16 Javascript
JS正则表达式比较常见用法
2016/01/26 Javascript
Javascript实现图片轮播效果(一)让图片跳动起来
2016/02/17 Javascript
微信小程序实现星级评分和展示
2018/07/05 Javascript
vue.js绑定事件监听器示例【基于v-on事件绑定】
2018/07/07 Javascript
解决vue-cli webpack打包后加载资源的路径问题
2018/09/25 Javascript
jquery简单实现纵向的无缝滚动代码实例
2019/04/01 jQuery
基于jQuery的时间戳与日期间的转化
2019/06/21 jQuery
Vue.js 实现地址管理页面思路详解(地址添加、编辑、删除和设置默认地址)
2019/12/11 Javascript
解决小程序无法触发SESSION问题
2020/02/03 Javascript
Vue父组件向子组件传值以及data和props的区别详解
2020/03/02 Javascript
浅谈Python中的可变对象和不可变对象
2017/07/07 Python
Python贪心算法实例小结
2018/04/22 Python
python实现剪切功能
2019/01/23 Python
通过python实现弹窗广告拦截过程详解
2019/07/10 Python
基于Django signals 信号作用及用法详解
2020/03/28 Python
使用Keras实现简单线性回归模型操作
2020/06/12 Python
物理系毕业生自荐书范文
2014/02/22 职场文书
个人函授自我鉴定
2014/03/25 职场文书
低碳环保标语
2014/06/12 职场文书
小学综合实践活动总结
2014/07/07 职场文书
教师个人教学总结
2015/02/11 职场文书
JavaScript原始值与包装对象的详细介绍
2021/05/11 Javascript
详解CSS故障艺术
2021/05/25 HTML / CSS
在项目中使用redis做缓存的一些思路
2021/09/14 Redis
nginx安装以及配置的详细过程记录
2021/09/15 Servers
js不常见操作运算符总结
2021/11/20 Javascript