python+selenium+chromedriver实现爬虫示例代码


Posted in Python onApril 10, 2020

下载好所需程序

1.Selenium简介

Selenium是一个用于Web应用程序测试的工具,直接运行在浏览器中,就像真正的用户在操作一样。

2.Selenium安装

方法一:在Windows命令行(cmd)输入pip install selenium即可自动安装,安装完成后,输入pip show selenium可查看当前的版本

python+selenium+chromedriver实现爬虫示例代码

方法二:直接下载selenium包:

selenium下载网址

Pychome安装selenium如果出现无法安装,参考以下博客
解决Pycharm无法使用已经安装Selenium的问题

3.禁止谷歌浏览器自动更新

搜索本地:管理工具-服务-Google自动更新服务-选择禁止

python+selenium+chromedriver实现爬虫示例代码

安装浏览器对应的驱动driver
我这里用的是谷歌,选择对应的驱动版本

驱动的下载地址如下:

http://chromedriver.storage.googleapis.com/index.html

python+selenium+chromedriver实现爬虫示例代码

python+selenium+chromedriver实现爬虫示例代码

win32、win64的都下载win32.zip的

将下载的chromedriver进行解压,并将文件复制或移动到,浏览器快捷方式所在目录。

环境变量配置
1.Python环境配置
2.chromedriver环境配置
3.pychrome的python环境指向自己电脑安装好的python

注意:将下载好的chromewebdriver.exe驱动放在Python的安装路径下的Scripts里面,同时将Scripts路径添加到PATH中,这样每次运行python的时候就会自动加载驱动

代码实现

#已经准备环境:webdriver:Google已经安装好;环境变量配置好;pip install selenium;
#selenium是一个包,包有很多对象,对象有属性,方法。
from selenium import webdriver
browser=webdriver.Chrome()#打开浏览器
url="https://news.qq.com/zt2020/page/feiyan.htm#/global?nojump=1"#获取数据的地址
#请求浏览器内容:请求方式:get,post,token
browser.get(url)
#css选择器,id选择器:#开头,class选择器:.开头,标签选择器:p,span,div。
coronavirus_countent=browser.find_element_by_class_name('d')#定位到class选择器d这个内容
print(coronavirus_countent)#查看内容,session,一种缓存机制,通过浏览器解析,然后缓存的内容
# <selenium.webdriver.remote.webelement.WebElement (session="a1aa22161543b44f599e97b35dbc1ac5", element="fe645993-43cb-46cf-83a7-2488dd3d838a")>
print(coronavirus_countent.text)#查看当前css.class中的d的内容

coronavirus_time=browser.find_element_by_class_name('ml')#定位到class选择器d这个内容
print(coronavirus_time.text)


coronavirus_data=browser.find_element_by_class_name('nowConfirm')#定位到class选择器d这个内容
print("=======")
print(coronavirus_data.text)

print("=====找nowConfirm下面的字内容")
coronavirus_sub=coronavirus_data.find_element_by_class_name('addnum')
print(coronavirus_sub.text)
browser.quit()

到此这篇关于python+selenium+chromedriver实现爬虫示例代码的文章就介绍到这了,更多相关python selenium chromedriver 爬虫内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python转码问题的解决方法
Oct 07 Python
python中as用法实例分析
Apr 30 Python
python的构建工具setup.py的方法使用示例
Oct 23 Python
Python:Scrapy框架中Item Pipeline组件使用详解
Dec 27 Python
Numpy array数据的增、删、改、查实例
Jun 04 Python
使用python对文件中的单词进行提取的方法示例
Dec 21 Python
Python代码打开本地.mp4格式文件的方法
Jan 03 Python
Python一键查找iOS项目中未使用的图片、音频、视频资源
Aug 12 Python
基于Python获取docx/doc文件内容代码解析
Feb 17 Python
Python发送手机动态验证码代码实例
Feb 28 Python
Django Path转换器自定义及正则代码实例
May 29 Python
Django+Uwsgi+Nginx如何实现生产环境部署
Jul 31 Python
Python3操作读写CSV文件使用包过程解析
Apr 10 #Python
快速解决jupyter启动卡死的问题
Apr 10 #Python
Python操作Jira库常用方法解析
Apr 10 #Python
jupyter notebook 使用过程中python莫名崩溃的原因及解决方式
Apr 10 #Python
jupyter lab的目录调整及设置默认浏览器为chrome的方法
Apr 10 #Python
jupyter notebook 参数传递给shell命令行实例
Apr 10 #Python
调整Jupyter notebook的启动目录操作
Apr 10 #Python
You might like
Thinkphp中的volist标签用法简介
2014/06/18 PHP
PHP统计数值数组中出现频率最多的10个数字的方法
2015/04/20 PHP
浅谈ThinkPHP5.0版本和ThinkPHP3.2版本的区别
2017/06/17 PHP
PHP实现的AES加密、解密封装类与用法示例
2018/08/02 PHP
会自动逐行上升的文本框
2006/06/30 Javascript
javascript数组使用调用方法汇总
2007/12/08 Javascript
JavaScript 判断日期格式是否正确的实现代码
2011/07/04 Javascript
jQuery $.get 的妙用 访问本地文本文件
2012/07/12 Javascript
js下拉选择框与输入框联动实现添加选中值到输入框的方法
2015/08/17 Javascript
JavaScript中的各种操作符使用总结
2016/05/26 Javascript
JS Array创建及concat()split()slice()的使用方法
2016/06/03 Javascript
javascript数组遍历的方法实例分析
2016/09/13 Javascript
微信小程序 用户数据解密详细介绍
2017/01/09 Javascript
Bootstrap.css与layDate日期选择样式起冲突的解决办法
2017/04/07 Javascript
前端页面文件拖拽上传模块js代码示例
2017/05/19 Javascript
JS 实现分页打印功能
2018/05/16 Javascript
Flutter 超实用简单菜单弹出框 PopupMenuButton功能
2019/08/06 Javascript
vuex vue简单使用知识点总结
2019/08/29 Javascript
JavaScript中的执行环境和作用域链
2020/09/04 Javascript
Pyramid将models.py文件的内容分布到多个文件的方法
2013/11/27 Python
OpenCV实现人脸识别
2017/04/07 Python
Python元组及文件核心对象类型详解
2018/02/11 Python
Python实现按中文排序的方法示例
2018/04/25 Python
Python用for循环实现九九乘法表
2018/05/31 Python
Python如何使用argparse模块处理命令行参数
2019/12/11 Python
Python任务自动化工具tox使用教程
2020/03/17 Python
Tensorflow之MNIST CNN实现并保存、加载模型
2020/06/17 Python
Python爬虫开发与项目实战
2020/12/16 Python
Python jieba库分词模式实例用法
2021/01/13 Python
HTML5 图片悬停放大的实现代码示例
2019/12/04 HTML / CSS
对教师的评语
2014/04/28 职场文书
共产党员公开承诺践诺书
2014/05/28 职场文书
史上最牛的辞职信
2015/02/28 职场文书
小学六一主持词开场白
2015/05/28 职场文书
幼儿园教学反思范文
2016/03/02 职场文书
node.js使用express-fileupload中间件实现文件上传
2021/07/16 Javascript