python+selenium实现自动化百度搜索关键词


Posted in Python onJune 03, 2019

通过python配合爬虫接口利用selenium实现自动化打开chrome浏览器,进行百度关键词搜索。

1、安装python3,访问官网选择对应的版本安装即可,最新版为3.7。

python+selenium实现自动化百度搜索关键词

2、安装selenium库。

使用 pip install selenium 安装即可。

同时需要安装chromedriver,并放在python安装文件夹下,如下图所示。

python+selenium实现自动化百度搜索关键词

3、获取爬虫接口链接。

注册账号,点击爬虫代理,领取每日试用。

python+selenium实现自动化百度搜索关键词

from selenium import webdriver 

import requests,time 

 #自建IP池 

def get_proxy():

  r = requests.get('http://127.0.0.1:5555/random')

  return r.text 

import random 

FILE = './tuziip.txt' 

# 读取的txt文件路径 

# 获取代理IP 

def proxy_ip():

  ip_list = []

  with open(FILE, 'r') as f:

    while True:

      line = f.readline()

      if not line:

        break

      ip_list.append(line.strip())

  ip_port = random.choice(ip_list)

  return ip_port 

def bd():

  chromeOptions = webdriver.ChromeOptions()

  # 设置代理  

chromeOptions.add_argument("--proxy-server=http://"+proxy_ip())  

# 一定要注意,=两边不能有空格,不能是这样--proxy-server = http://202.20.16.82:10152

  browser = webdriver.Chrome(chrome_options = chromeOptions)  

# 查看本机ip,查看代理是否起作用  

  browser.get("https://www.baidu.com/")  

  browser.find_element_by_id("kw").send_keys("ip")

  browser.find_element_by_id("su").click()

  time.sleep(2)

  browser.find_element_by_id("kw").clear()

  time.sleep(1)

  browser.find_element_by_id("kw").send_keys("百度")

  browser.find_element_by_id("su").click()

  time.sleep(2)

  browser.find_element_by_id("kw").clear()

  time.sleep(1)

  browser.find_element_by_id("kw").send_keys("百度")

  browser.find_element_by_id("su").click()

  time.sleep(2)

  browser.find_element_by_id("kw").clear()

  time.sleep(1)

  browser.close()  

# 退出,清除浏览器缓存

  browser.quit() 

if __name__ == "__main__":

  while True:

    bd()

5、运行程序,如下图所示,可自动化搜索。

python+selenium实现自动化百度搜索关键词

Python 相关文章推荐
浅析Python中的多进程与多线程的使用
Apr 07 Python
深入理解Python变量与常量
Jun 02 Python
Python 多线程实例详解
Mar 25 Python
利用python批量修改word文件名的方法示例
Oct 17 Python
python实现nao机器人手臂动作控制
Apr 29 Python
python实现几种归一化方法(Normalization Method)
Jul 31 Python
Django使用 Bootstrap 样式修改书籍列表过程解析
Aug 09 Python
Python实现网页截图(PyQT5)过程解析
Aug 12 Python
Python学习笔记之函数的参数和返回值的使用
Nov 20 Python
Django haystack实现全文搜索代码示例
Nov 28 Python
python中subplot大小的设置步骤
Jun 28 Python
Python Django获取URL中的数据详解
Nov 01 Python
用Q-learning算法实现自动走迷宫机器人的方法示例
Jun 03 #Python
Python多进程方式抓取基金网站内容的方法分析
Jun 03 #Python
Python多进程入门、分布式进程数据共享实例详解
Jun 03 #Python
Python3实现定时任务的四种方式
Jun 03 #Python
500行Python代码打造刷脸考勤系统
Jun 03 #Python
Python学习笔记之pandas索引列、过滤、分组、求和功能示例
Jun 03 #Python
Python学习笔记之抓取某只基金历史净值数据实战案例
Jun 03 #Python
You might like
php 清除网页病毒的方法
2008/12/05 PHP
模板引擎正则表达式调试小技巧
2011/07/20 PHP
九个你必须知道而且又很好用的php函数和特点
2013/08/08 PHP
PHP可变函数学习小结
2015/11/29 PHP
php通过淘宝API查询IP地址归属等信息
2015/12/25 PHP
yii权限控制的方法(三种方法)
2015/12/28 PHP
Jvascript学习实践案例(开发常用)
2012/06/25 Javascript
js对table的td进行相同内容合并示例详解
2013/12/27 Javascript
很实用的js选项卡切换效果
2016/08/12 Javascript
jquery中用jsonp实现搜索框功能
2016/10/18 Javascript
AngularJS中指令的四种基本形式实例分析
2016/11/22 Javascript
AngularJS表单验证功能
2017/10/19 Javascript
JS逻辑运算符短路操作实例分析
2018/07/09 Javascript
Nuxt升级2.0.0时出现的问题(小结)
2018/10/08 Javascript
vue最简单的前后端交互示例详解
2018/10/11 Javascript
使用webpack编译es6代码的方法步骤
2019/04/28 Javascript
基于layui内置模块(element常用元素的操作)
2019/09/20 Javascript
JavaScript如何处理移动端拍摄图片旋转问题
2019/11/16 Javascript
Openlayers学习之加载鹰眼控件
2020/09/28 Javascript
[02:39]DOTA2英雄基础教程 天怒法师
2013/11/29 DOTA
python为tornado添加recaptcha验证码功能
2014/02/26 Python
python 简单的多线程链接实现代码
2016/08/28 Python
100行python代码实现跳一跳辅助程序
2018/01/15 Python
TensorFlow损失函数专题详解
2018/04/26 Python
python 随机森林算法及其优化详解
2019/07/11 Python
pandas如何处理缺失值
2019/07/31 Python
CSS3中Color的一些特性介绍
2012/05/27 HTML / CSS
Raleigh兰令自行车美国官网:英国凤头牌自行车
2018/01/08 全球购物
乌克兰机票、铁路和巴士票、酒店搜索、保险:Tickets.ua
2020/01/11 全球购物
建筑设计所实习生自我鉴定
2013/09/25 职场文书
工作表现评语
2014/01/19 职场文书
个人银行贷款担保书
2014/04/01 职场文书
2014年学校教学工作总结
2014/12/06 职场文书
个人年度总结报告
2015/03/09 职场文书
2016年中学端午节主题活动总结
2016/04/01 职场文书
新的CSS 伪类函数 :is() 和 :where()示例详解
2022/08/05 HTML / CSS