python+selenium+chromedriver实现爬虫示例代码


Posted in Python onApril 10, 2020

下载好所需程序

1.Selenium简介

Selenium是一个用于Web应用程序测试的工具,直接运行在浏览器中,就像真正的用户在操作一样。

2.Selenium安装

方法一:在Windows命令行(cmd)输入pip install selenium即可自动安装,安装完成后,输入pip show selenium可查看当前的版本

python+selenium+chromedriver实现爬虫示例代码

方法二:直接下载selenium包:

selenium下载网址

Pychome安装selenium如果出现无法安装,参考以下博客
解决Pycharm无法使用已经安装Selenium的问题

3.禁止谷歌浏览器自动更新

搜索本地:管理工具-服务-Google自动更新服务-选择禁止

python+selenium+chromedriver实现爬虫示例代码

安装浏览器对应的驱动driver
我这里用的是谷歌,选择对应的驱动版本

驱动的下载地址如下:

http://chromedriver.storage.googleapis.com/index.html

python+selenium+chromedriver实现爬虫示例代码

python+selenium+chromedriver实现爬虫示例代码

win32、win64的都下载win32.zip的

将下载的chromedriver进行解压,并将文件复制或移动到,浏览器快捷方式所在目录。

环境变量配置
1.Python环境配置
2.chromedriver环境配置
3.pychrome的python环境指向自己电脑安装好的python

注意:将下载好的chromewebdriver.exe驱动放在Python的安装路径下的Scripts里面,同时将Scripts路径添加到PATH中,这样每次运行python的时候就会自动加载驱动

代码实现

#已经准备环境:webdriver:Google已经安装好;环境变量配置好;pip install selenium;
#selenium是一个包,包有很多对象,对象有属性,方法。
from selenium import webdriver
browser=webdriver.Chrome()#打开浏览器
url="https://news.qq.com/zt2020/page/feiyan.htm#/global?nojump=1"#获取数据的地址
#请求浏览器内容:请求方式:get,post,token
browser.get(url)
#css选择器,id选择器:#开头,class选择器:.开头,标签选择器:p,span,div。
coronavirus_countent=browser.find_element_by_class_name('d')#定位到class选择器d这个内容
print(coronavirus_countent)#查看内容,session,一种缓存机制,通过浏览器解析,然后缓存的内容
# <selenium.webdriver.remote.webelement.WebElement (session="a1aa22161543b44f599e97b35dbc1ac5", element="fe645993-43cb-46cf-83a7-2488dd3d838a")>
print(coronavirus_countent.text)#查看当前css.class中的d的内容

coronavirus_time=browser.find_element_by_class_name('ml')#定位到class选择器d这个内容
print(coronavirus_time.text)


coronavirus_data=browser.find_element_by_class_name('nowConfirm')#定位到class选择器d这个内容
print("=======")
print(coronavirus_data.text)

print("=====找nowConfirm下面的字内容")
coronavirus_sub=coronavirus_data.find_element_by_class_name('addnum')
print(coronavirus_sub.text)
browser.quit()

到此这篇关于python+selenium+chromedriver实现爬虫示例代码的文章就介绍到这了,更多相关python selenium chromedriver 爬虫内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中使用HTMLParser解析html实例
Feb 08 Python
python使用fcntl模块实现程序加锁功能示例
Jun 23 Python
Python SVM(支持向量机)实现方法完整示例
Jun 19 Python
Python Series从0开始索引的方法
Nov 06 Python
Python爬虫抓取技术的一些经验
Jul 12 Python
python3 enum模块的应用实例详解
Aug 12 Python
Python 使用 prettytable 库打印表格美化输出功能
Dec 26 Python
Python 爬取必应壁纸的实例讲解
Feb 24 Python
django使用JWT保存用户登录信息
Apr 22 Python
Python爬虫获取豆瓣电影并写入excel
Jul 31 Python
python实现简单遗传算法
Sep 18 Python
Selenium 配置启动项参数的方法
Dec 04 Python
Python3操作读写CSV文件使用包过程解析
Apr 10 #Python
快速解决jupyter启动卡死的问题
Apr 10 #Python
Python操作Jira库常用方法解析
Apr 10 #Python
jupyter notebook 使用过程中python莫名崩溃的原因及解决方式
Apr 10 #Python
jupyter lab的目录调整及设置默认浏览器为chrome的方法
Apr 10 #Python
jupyter notebook 参数传递给shell命令行实例
Apr 10 #Python
调整Jupyter notebook的启动目录操作
Apr 10 #Python
You might like
雄兵连:第三季确定会出,不过时间未定,鹤熙是第三季的主角!
2020/03/13 国漫
百度工程师讲PHP函数的实现原理及性能分析(一)
2015/05/13 PHP
PHP+redis实现添加处理投票的方法
2015/11/14 PHP
php上传图片类及用法示例
2016/05/11 PHP
php无法连接mysql数据库的正确解决方法
2016/07/01 PHP
几个javascript操作word的参考代码
2009/10/26 Javascript
jquery maxlength使用说明
2011/09/09 Javascript
JQuery防止退格键网页后退的实现代码
2012/03/23 Javascript
js将字符串转成正则表达式的实现方法
2013/11/13 Javascript
JavaScript避免代码的重复执行经验技巧分享
2014/04/17 Javascript
Javascript中获取对象的原型对象的方法小结
2015/02/25 Javascript
javascript数组随机排序实例分析
2015/07/22 Javascript
盘点javascript 正则表达式中 中括号的【坑】
2016/03/16 Javascript
Bootstrap Table使用整理(二)
2017/06/09 Javascript
Vue.js实现按钮的动态绑定效果及实现代码
2017/08/21 Javascript
JavaScript设计模式之建造者模式实例教程
2018/07/02 Javascript
vue vue-Router默认hash模式修改为history需要做的修改详解
2018/09/13 Javascript
详解jQuery-each()方法
2019/03/13 jQuery
webpack4 从零学习常用配置(小结)
2019/05/28 Javascript
JS中的const命令你真懂它吗
2020/03/08 Javascript
Vue使用Ref跨层级获取组件的步骤
2021/01/25 Vue.js
[34:47]完美世界DOTA2联赛PWL S2 Magma vs LBZS 第一场 11.18
2020/11/18 DOTA
详细解析Python中__init__()方法的高级应用
2015/05/11 Python
从零开始学Python第八周:详解网络编程基础(socket)
2016/12/14 Python
python引用(import)某个模块提示没找到对应模块的解决方法
2019/01/19 Python
使用python serial 获取所有的串口名称的实例
2019/07/02 Python
Python-numpy实现灰度图像的分块和合并方式
2020/01/09 Python
基于plt.title无法显示中文的快速解决
2020/05/16 Python
Django配置跨域并开发测试接口
2020/11/04 Python
彻底解决Python包下载慢问题
2020/11/15 Python
会计毕业生自荐书
2014/06/12 职场文书
大学生学习计划书
2014/09/15 职场文书
企业党的群众路线教育实践活动学习心得体会
2014/10/31 职场文书
详解MySQL InnoDB存储引擎的内存管理
2021/04/08 MySQL
SpringMVC 整合SSM框架详解
2021/08/30 Java/Android
vue @click.native 绑定原生点击事件
2022/04/22 Vue.js