python 爬取免费简历模板网站的示例


Posted in Python onSeptember 27, 2020

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

爬取结果

python 爬取免费简历模板网站的示例

python 爬取免费简历模板网站的示例

以上就是python 爬取免费简历模板网站的示例的详细内容,更多关于python 爬取网站的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python操作RabbitMQ服务器实现消息队列的路由功能
Jun 29 Python
python调用Delphi写的Dll代码示例
Dec 05 Python
Python中偏函数用法示例
Jun 07 Python
使用Python抓取豆瓣影评数据的方法
Oct 17 Python
Python实现定时自动关闭的tkinter窗口方法
Feb 16 Python
Python File(文件) 方法整理
Feb 18 Python
手把手教你pycharm专业版安装破解教程(linux版)
Sep 26 Python
详解pandas绘制矩阵散点图(scatter_matrix)的方法
Apr 23 Python
python 操作mysql数据中fetchone()和fetchall()方式
May 15 Python
python使用for...else跳出双层嵌套循环的方法实例
May 17 Python
python进度条显示-tqmd模块的实现示例
Aug 23 Python
用python自动生成日历
Apr 24 Python
python如何提升爬虫效率
Sep 27 #Python
python操作链表的示例代码
Sep 27 #Python
python用tkinter实现一个简易能进行随机点名的界面
Sep 27 #Python
python实现暗通道去雾算法的示例
Sep 27 #Python
谈谈python垃圾回收机制
Sep 27 #Python
如何在python中处理配置文件代码实例
Sep 27 #Python
Python 开发工具通过 agent 代理使用的方法
Sep 27 #Python
You might like
一个php作的文本留言本的例子(四)
2006/10/09 PHP
phpmyadmin 访问被拒绝的真实原因
2009/06/15 PHP
基于empty函数的输出详解
2013/06/17 PHP
Php中使用Select 查询语句的实例
2014/02/19 PHP
PHP扩展程序实现守护进程
2015/04/16 PHP
php获得客户端浏览器名称及版本的方法(基于ECShop函数)
2015/12/23 PHP
javascript中的缓动效果实现程序
2012/12/29 Javascript
Query中click(),bind(),live(),delegate()的区别
2013/11/19 Javascript
javascript中caller和callee详解
2015/08/10 Javascript
BootStrap Progressbar 实现大文件上传的进度条的实例代码
2016/06/27 Javascript
React入门教程之Hello World以及环境搭建详解
2017/07/11 Javascript
bootstrap paginator分页插件的两种使用方式实例详解
2017/11/14 Javascript
Nuxt.js 数据双向绑定的实现
2019/02/17 Javascript
VsCode与Node.js知识点详解
2019/09/05 Javascript
layui 实现二级弹窗弹出之后 关闭一级弹窗的方法
2019/09/18 Javascript
JavaScript实现原型封装轮播图
2020/12/27 Javascript
[02:54]DOTA2亚洲邀请赛 VG战队出场宣传片
2015/02/07 DOTA
[53:15]Newbee vs Pain 2018国际邀请赛小组赛BO2 第二场 8.16
2018/08/17 DOTA
[58:54]EG vs RNG 2019国际邀请赛小组赛 BO2 第一场 8.16
2019/08/18 DOTA
Python自定义一个类实现字典dict功能的方法
2019/01/19 Python
简单了解django处理跨域请求最佳解决方案
2020/03/25 Python
利用python如何实现猫捉老鼠小游戏
2020/12/04 Python
手机端用rem+scss做适配的详解
2017/11/15 HTML / CSS
Mixbook加拿大:照片书,照片卡,剪贴簿,年历和日历
2017/02/21 全球购物
马来西亚最热门的在线时尚商店:FashionValet
2018/11/11 全球购物
介绍一下linux文件系统分配策略
2013/02/25 面试题
商场中秋节广播稿
2014/01/17 职场文书
公司爱心捐款倡议书
2014/05/14 职场文书
初一新生军训方案
2014/05/22 职场文书
广告学专业毕业生自荐信
2014/05/28 职场文书
ktv好的活动方案
2014/08/17 职场文书
事业单位个人查摆问题及整改措施
2014/10/28 职场文书
2014年青年教师工作总结
2014/12/17 职场文书
申请吧主发表的感言
2015/08/03 职场文书
学习社交礼仪心得体会
2016/01/22 职场文书
python中的random模块和相关函数详解
2022/04/22 Python