python 爬取免费简历模板网站的示例


Posted in Python onSeptember 27, 2020

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

爬取结果

python 爬取免费简历模板网站的示例

python 爬取免费简历模板网站的示例

以上就是python 爬取免费简历模板网站的示例的详细内容,更多关于python 爬取网站的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python基础教程之对象和类的实际运用
Aug 29 Python
Python中使用socket发送HTTP请求数据接收不完整问题解决方法
Feb 04 Python
Python装饰器入门学习教程(九步学习)
Jan 28 Python
详解Python读取配置文件模块ConfigParser
May 11 Python
利用python实现简单的循环购物车功能示例代码
Jul 05 Python
python实现简易云音乐播放器
Jan 04 Python
python3使用smtplib实现发送邮件功能
May 22 Python
详解python项目实战:模拟登陆CSDN
Apr 04 Python
python 批量修改 labelImg 生成的xml文件的方法
Sep 09 Python
python 绘制正态曲线的示例
Sep 24 Python
使用Python制作一个数据预处理小工具(多种操作一键完成)
Feb 07 Python
python b站视频下载的五种版本
May 27 Python
python如何提升爬虫效率
Sep 27 #Python
python操作链表的示例代码
Sep 27 #Python
python用tkinter实现一个简易能进行随机点名的界面
Sep 27 #Python
python实现暗通道去雾算法的示例
Sep 27 #Python
谈谈python垃圾回收机制
Sep 27 #Python
如何在python中处理配置文件代码实例
Sep 27 #Python
Python 开发工具通过 agent 代理使用的方法
Sep 27 #Python
You might like
Session服务器配置指南与使用经验的深入解析
2013/06/17 PHP
PHP同时连接多个mysql数据库示例代码
2014/03/17 PHP
php实现mysql数据库连接操作及用户管理
2015/11/08 PHP
PHP接口类(interface)的定义、特点和应用示例
2020/05/18 PHP
ThinkPhP+Apache+PHPstorm整合框架流程图解
2020/11/23 PHP
网页中JS函数自动执行常用三种方法
2016/03/30 Javascript
js实现千分符和保留几位小数的简单实例
2016/08/01 Javascript
jQuery向父辈遍历的简单方法
2016/09/18 Javascript
js时间戳和c#时间戳互转方法(推荐)
2017/02/15 Javascript
Vue.js开发环境快速搭建教程
2017/03/17 Javascript
angularjs数组判断是否含有某个元素的实例
2018/02/27 Javascript
Vue.js 表单控件操作小结
2018/03/29 Javascript
vue和webpack安装命令详解
2018/06/15 Javascript
快速解决vue动态绑定多个class的官方实例语法无效的问题
2018/09/05 Javascript
解决angular2在双向数据绑定时[(ngModel)]无法使用的问题
2018/09/13 Javascript
vue组件化中slot的基本使用方法
2019/05/01 Javascript
react实现移动端下拉菜单的示例代码
2020/01/16 Javascript
[03:21]辉夜杯主赛事 12月25日TOP5
2015/12/26 DOTA
Python创建一个空的dataframe,并循环赋值的方法
2018/11/08 Python
解决Pandas的DataFrame输出截断和省略的问题
2019/02/08 Python
用Python写一个模拟qq聊天小程序的代码实例
2019/03/06 Python
Python3.5局部变量与全局变量作用域实例分析
2019/04/30 Python
Python如何使用k-means方法将列表中相似的句子归类
2019/08/08 Python
Python 中的 global 标识对变量作用域的影响
2019/08/12 Python
python tkinter之顶层菜单、弹出菜单实例
2020/03/04 Python
python 多线程中join()的作用
2020/10/29 Python
Python OpenCV中的numpy与图像类型转换操作
2020/12/11 Python
matplotlib 画动态图以及plt.ion()和plt.ioff()的使用详解
2021/01/05 Python
欧缇丽英国官方网站:Caudalie英国
2016/08/17 全球购物
Raleigh兰令自行车美国官网:英国凤头牌自行车
2018/01/08 全球购物
生日礼品店创业计划书范文
2014/03/21 职场文书
给医院的感谢信
2015/01/21 职场文书
小学教师年度个人总结
2015/02/05 职场文书
教师工作能力自我评价
2015/03/04 职场文书
青年干部培训班学习心得体会
2016/01/06 职场文书
SQL实现LeetCode(197.上升温度)
2021/08/07 MySQL