编程 Python

python 爬取免费简历模板网站的示例

Posted in Python onSeptember 27, 2020

代码

# 免费的简历模板进行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下载页面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下载成功!')

以上就是python 爬取免费简历模板网站的示例的详细内容，更多关于python 爬取网站的资料请关注三水点靠木其它相关文章！

python 爬取免费简历模板网站的示例

- Author -

straightup

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python基础教程之对象和类的实际运用

Aug 29 Python

Python中使用socket发送HTTP请求数据接收不完整问题解决方法

Feb 04 Python

Python装饰器入门学习教程(九步学习)

Jan 28 Python

详解Python读取配置文件模块ConfigParser

May 11 Python

利用python实现简单的循环购物车功能示例代码

Jul 05 Python

python实现简易云音乐播放器

Jan 04 Python

python3使用smtplib实现发送邮件功能

May 22 Python

详解python项目实战:模拟登陆CSDN

Apr 04 Python

python 批量修改 labelImg 生成的xml文件的方法

Sep 09 Python

python 绘制正态曲线的示例

Sep 24 Python

使用Python制作一个数据预处理小工具(多种操作一键完成)

Feb 07 Python

python b站视频下载的五种版本

May 27 Python

python如何提升爬虫效率

Sep 27 #Python

python操作链表的示例代码

Sep 27 #Python

python用tkinter实现一个简易能进行随机点名的界面

Sep 27 #Python

python实现暗通道去雾算法的示例

Sep 27 #Python

谈谈python垃圾回收机制

Sep 27 #Python

如何在python中处理配置文件代码实例

Sep 27 #Python

Python 开发工具通过 agent 代理使用的方法

Sep 27 #Python

You might like

Session服务器配置指南与使用经验的深入解析

2013/06/17 PHP

PHP同时连接多个mysql数据库示例代码

2014/03/17 PHP

php实现mysql数据库连接操作及用户管理

2015/11/08 PHP

PHP接口类（interface）的定义、特点和应用示例

2020/05/18 PHP

ThinkPhP+Apache+PHPstorm整合框架流程图解

2020/11/23 PHP

网页中JS函数自动执行常用三种方法

2016/03/30 Javascript

js实现千分符和保留几位小数的简单实例

2016/08/01 Javascript

jQuery向父辈遍历的简单方法

2016/09/18 Javascript

js时间戳和c#时间戳互转方法(推荐)

2017/02/15 Javascript

Vue.js开发环境快速搭建教程

2017/03/17 Javascript

angularjs数组判断是否含有某个元素的实例

2018/02/27 Javascript

Vue.js 表单控件操作小结

2018/03/29 Javascript

vue和webpack安装命令详解

2018/06/15 Javascript

快速解决vue动态绑定多个class的官方实例语法无效的问题

2018/09/05 Javascript

解决angular2在双向数据绑定时[(ngModel)]无法使用的问题

2018/09/13 Javascript

vue组件化中slot的基本使用方法

2019/05/01 Javascript

react实现移动端下拉菜单的示例代码

2020/01/16 Javascript

[03:21]辉夜杯主赛事 12月25日TOP5

2015/12/26 DOTA

Python创建一个空的dataframe,并循环赋值的方法

2018/11/08 Python

解决Pandas的DataFrame输出截断和省略的问题

2019/02/08 Python

用Python写一个模拟qq聊天小程序的代码实例

2019/03/06 Python

Python3.5局部变量与全局变量作用域实例分析

2019/04/30 Python

Python如何使用k-means方法将列表中相似的句子归类

2019/08/08 Python

Python 中的 global 标识对变量作用域的影响

2019/08/12 Python

python tkinter之顶层菜单、弹出菜单实例

2020/03/04 Python

python 多线程中join()的作用

2020/10/29 Python

Python OpenCV中的numpy与图像类型转换操作

2020/12/11 Python

matplotlib 画动态图以及plt.ion()和plt.ioff()的使用详解

2021/01/05 Python

欧缇丽英国官方网站：Caudalie英国

2016/08/17 全球购物

Raleigh兰令自行车美国官网：英国凤头牌自行车

2018/01/08 全球购物

生日礼品店创业计划书范文

2014/03/21 职场文书

给医院的感谢信

2015/01/21 职场文书

小学教师年度个人总结

2015/02/05 职场文书

教师工作能力自我评价

2015/03/04 职场文书

青年干部培训班学习心得体会

2016/01/06 职场文书

SQL实现LeetCode(197.上升温度)

2021/08/07 MySQL