python+selenium实现自动化百度搜索关键词


Posted in Python onJune 03, 2019

通过python配合爬虫接口利用selenium实现自动化打开chrome浏览器,进行百度关键词搜索。

1、安装python3,访问官网选择对应的版本安装即可,最新版为3.7。

python+selenium实现自动化百度搜索关键词

2、安装selenium库。

使用 pip install selenium 安装即可。

同时需要安装chromedriver,并放在python安装文件夹下,如下图所示。

python+selenium实现自动化百度搜索关键词

3、获取爬虫接口链接。

注册账号,点击爬虫代理,领取每日试用。

python+selenium实现自动化百度搜索关键词

from selenium import webdriver 

import requests,time 

 #自建IP池 

def get_proxy():

  r = requests.get('http://127.0.0.1:5555/random')

  return r.text 

import random 

FILE = './tuziip.txt' 

# 读取的txt文件路径 

# 获取代理IP 

def proxy_ip():

  ip_list = []

  with open(FILE, 'r') as f:

    while True:

      line = f.readline()

      if not line:

        break

      ip_list.append(line.strip())

  ip_port = random.choice(ip_list)

  return ip_port 

def bd():

  chromeOptions = webdriver.ChromeOptions()

  # 设置代理  

chromeOptions.add_argument("--proxy-server=http://"+proxy_ip())  

# 一定要注意,=两边不能有空格,不能是这样--proxy-server = http://202.20.16.82:10152

  browser = webdriver.Chrome(chrome_options = chromeOptions)  

# 查看本机ip,查看代理是否起作用  

  browser.get("https://www.baidu.com/")  

  browser.find_element_by_id("kw").send_keys("ip")

  browser.find_element_by_id("su").click()

  time.sleep(2)

  browser.find_element_by_id("kw").clear()

  time.sleep(1)

  browser.find_element_by_id("kw").send_keys("百度")

  browser.find_element_by_id("su").click()

  time.sleep(2)

  browser.find_element_by_id("kw").clear()

  time.sleep(1)

  browser.find_element_by_id("kw").send_keys("百度")

  browser.find_element_by_id("su").click()

  time.sleep(2)

  browser.find_element_by_id("kw").clear()

  time.sleep(1)

  browser.close()  

# 退出,清除浏览器缓存

  browser.quit() 

if __name__ == "__main__":

  while True:

    bd()

5、运行程序,如下图所示,可自动化搜索。

python+selenium实现自动化百度搜索关键词

Python 相关文章推荐
python的dict,set,list,tuple应用详解
Jul 24 Python
详解Python的Django框架中的模版相关知识
Jul 15 Python
Python的Django框架中自定义模版标签的示例
Jul 20 Python
python用reduce和map把字符串转为数字的方法
Dec 19 Python
python嵌套字典比较值与取值的实现示例
Nov 03 Python
Python+tkinter模拟“记住我”自动登录实例代码
Jan 16 Python
python调用百度语音识别api
Aug 30 Python
python实现对指定字符串补足固定长度倍数截断输出的方法
Nov 15 Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 Python
Django打印出在数据库中执行的语句问题
Jul 25 Python
Python实现bilibili时间长度查询的示例代码
Jan 14 Python
sklearn中的交叉验证的实现(Cross-Validation)
Feb 22 Python
用Q-learning算法实现自动走迷宫机器人的方法示例
Jun 03 #Python
Python多进程方式抓取基金网站内容的方法分析
Jun 03 #Python
Python多进程入门、分布式进程数据共享实例详解
Jun 03 #Python
Python3实现定时任务的四种方式
Jun 03 #Python
500行Python代码打造刷脸考勤系统
Jun 03 #Python
Python学习笔记之pandas索引列、过滤、分组、求和功能示例
Jun 03 #Python
Python学习笔记之抓取某只基金历史净值数据实战案例
Jun 03 #Python
You might like
php中日期加减法运算实现代码
2011/12/08 PHP
PHP版本如何选择?应该使用哪个版本?
2015/05/13 PHP
java模拟PHP的pack和unpack类
2016/04/13 PHP
PHP+Mysql无刷新问答评论系统(源码)
2016/12/20 PHP
php 判断页面或图片是否经过gzip压缩的方法
2017/04/05 PHP
Ajax请求PHP后台接口返回信息的实例代码
2018/08/21 PHP
jQuery学习笔记之控制页面实现代码
2012/02/27 Javascript
jQuery关于导航条背景切换效果实现示例
2013/09/04 Javascript
JS中类或对象的定义说明
2014/03/10 Javascript
使用phantomjs进行网页抓取的实现代码
2014/09/29 Javascript
基于React.js实现原生js拖拽效果引发的思考
2016/03/30 Javascript
jQuery源码分析之init的详细介绍
2017/02/13 Javascript
jQuery实现的背景颜色渐变动画效果示例
2017/03/24 jQuery
几种响应式文字详解
2017/05/19 Javascript
安装vue-cli报错 -4058 的解决方法
2017/10/19 Javascript
webpack热模块替换(HMR)/热更新的方法
2018/04/05 Javascript
layui当点击文本框时弹出选择框,显示选择内容的例子
2019/09/02 Javascript
浅谈vue-props的default写不写有什么区别
2020/08/09 Javascript
Python中使用urllib2防止302跳转的代码例子
2014/07/07 Python
Python中使用item()方法遍历字典的例子
2014/08/26 Python
python使用urllib2实现发送带cookie的请求
2015/04/28 Python
Python中序列的修改、散列与切片详解
2017/08/27 Python
Python调用graphviz绘制结构化图形网络示例
2019/11/22 Python
荷兰优雅女装网上商店:Heine
2016/11/14 全球购物
Emporio Armani腕表天猫官方旗舰店:乔治·阿玛尼为年轻人设计的副线品牌
2017/07/02 全球购物
Europcar澳大利亚官网:全球汽车租赁领域的领导者
2019/03/24 全球购物
马德里著名的运动鞋商店:NOIRFONCE
2019/04/12 全球购物
编写类String的构造函数、析构函数和赋值函数
2012/05/29 面试题
绩效专员岗位职责
2013/12/02 职场文书
中文专业自荐书
2014/06/29 职场文书
试用期员工工作自我评价
2014/09/10 职场文书
电影开国大典观后感
2015/06/04 职场文书
孙振耀退休感言
2015/08/01 职场文书
2019感恩宣传标语!
2019/07/05 职场文书
Django实现WebSocket在线聊天室功能(channels库)
2021/09/25 Python
React如何使用axios请求数据并把数据渲染到组件
2022/08/05 Javascript