python+selenium实现自动化百度搜索关键词


Posted in Python onJune 03, 2019

通过python配合爬虫接口利用selenium实现自动化打开chrome浏览器,进行百度关键词搜索。

1、安装python3,访问官网选择对应的版本安装即可,最新版为3.7。

python+selenium实现自动化百度搜索关键词

2、安装selenium库。

使用 pip install selenium 安装即可。

同时需要安装chromedriver,并放在python安装文件夹下,如下图所示。

python+selenium实现自动化百度搜索关键词

3、获取爬虫接口链接。

注册账号,点击爬虫代理,领取每日试用。

python+selenium实现自动化百度搜索关键词

from selenium import webdriver 

import requests,time 

 #自建IP池 

def get_proxy():

  r = requests.get('http://127.0.0.1:5555/random')

  return r.text 

import random 

FILE = './tuziip.txt' 

# 读取的txt文件路径 

# 获取代理IP 

def proxy_ip():

  ip_list = []

  with open(FILE, 'r') as f:

    while True:

      line = f.readline()

      if not line:

        break

      ip_list.append(line.strip())

  ip_port = random.choice(ip_list)

  return ip_port 

def bd():

  chromeOptions = webdriver.ChromeOptions()

  # 设置代理  

chromeOptions.add_argument("--proxy-server=http://"+proxy_ip())  

# 一定要注意,=两边不能有空格,不能是这样--proxy-server = http://202.20.16.82:10152

  browser = webdriver.Chrome(chrome_options = chromeOptions)  

# 查看本机ip,查看代理是否起作用  

  browser.get("https://www.baidu.com/")  

  browser.find_element_by_id("kw").send_keys("ip")

  browser.find_element_by_id("su").click()

  time.sleep(2)

  browser.find_element_by_id("kw").clear()

  time.sleep(1)

  browser.find_element_by_id("kw").send_keys("百度")

  browser.find_element_by_id("su").click()

  time.sleep(2)

  browser.find_element_by_id("kw").clear()

  time.sleep(1)

  browser.find_element_by_id("kw").send_keys("百度")

  browser.find_element_by_id("su").click()

  time.sleep(2)

  browser.find_element_by_id("kw").clear()

  time.sleep(1)

  browser.close()  

# 退出,清除浏览器缓存

  browser.quit() 

if __name__ == "__main__":

  while True:

    bd()

5、运行程序,如下图所示,可自动化搜索。

python+selenium实现自动化百度搜索关键词

Python 相关文章推荐
Python使用cx_Oracle模块将oracle中数据导出到csv文件的方法
May 16 Python
Python的Flask框架中配置多个子域名的方法讲解
Jun 07 Python
Python算法输出1-9数组形成的结果为100的所有运算式
Nov 03 Python
python模块之paramiko实例代码
Jan 31 Python
解决pycharm py文件运行后停止按钮变成了灰色的问题
Nov 29 Python
django框架model orM使用字典作为参数,保存数据的方法分析
Jun 24 Python
基于python调用psutil模块过程解析
Dec 20 Python
python 对象真假值的实例(哪些视为False)
Dec 11 Python
浏览器常用基本操作之python3+selenium4自动化测试(基础篇3)
May 21 Python
Python基础知识学习之类的继承
May 31 Python
pytorch 运行一段时间后出现GPU OOM的问题
Jun 02 Python
基于Python实现一个春节倒计时脚本
Jan 22 Python
用Q-learning算法实现自动走迷宫机器人的方法示例
Jun 03 #Python
Python多进程方式抓取基金网站内容的方法分析
Jun 03 #Python
Python多进程入门、分布式进程数据共享实例详解
Jun 03 #Python
Python3实现定时任务的四种方式
Jun 03 #Python
500行Python代码打造刷脸考勤系统
Jun 03 #Python
Python学习笔记之pandas索引列、过滤、分组、求和功能示例
Jun 03 #Python
Python学习笔记之抓取某只基金历史净值数据实战案例
Jun 03 #Python
You might like
点评山进PR-D3L三波段收音机
2021/03/02 无线电
用PHP提取中英文词语以及数字的首字母的方法介绍
2013/04/23 PHP
PHP实现返回JSON和XML的类分享
2015/01/28 PHP
解决ThinkPHP下使用上传插件Uploadify浏览器firefox报302错误的方法
2015/12/18 PHP
extjs tabpanel限制选项卡数量实现思路及代码
2013/04/02 Javascript
js实现在同一窗口浏览图片
2014/09/17 Javascript
推荐一款jQuery插件模板
2015/01/09 Javascript
JS仿Windows开机启动Loading进度条的方法
2015/02/26 Javascript
js图片轮播效果实现代码
2020/04/18 Javascript
Vuejs第九篇之组件作用域及props数据传递实例详解
2016/09/05 Javascript
网络传输协议(http协议)
2016/11/18 Javascript
利用js获取下拉框中所选的值
2016/12/01 Javascript
javascript正则表达式模糊匹配IP地址功能示例
2017/01/06 Javascript
jquery仿京东侧边栏导航效果
2017/03/02 Javascript
jQuery实现返回顶部按钮和scroll滚动功能[带动画效果]
2017/07/05 jQuery
AngularJS实现注册表单验证功能
2017/10/16 Javascript
LayUi中接口传数据成功,表格不显示数据的解决方法
2018/08/19 Javascript
three.js 利用uv和ThreeBSP制作一个快递柜功能
2020/08/18 Javascript
js 函数性能比较方法
2020/08/24 Javascript
vue-router 控制路由权限的实现
2020/09/24 Javascript
python实现目录树生成示例
2014/03/28 Python
Keras搭建自编码器操作
2020/07/03 Python
python上selenium的弹框操作实现
2020/07/13 Python
amazeui 验证按钮扩展的实现
2020/08/21 HTML / CSS
Ray-Ban雷朋太阳眼镜英国官网:Ray-Ban UK
2019/11/23 全球购物
有abstract方法的类一定要用abstract修饰吗
2016/03/14 面试题
自荐书范文
2013/12/08 职场文书
讲文明树新风公益广告宣传方案
2014/02/25 职场文书
诚实守信道德模范事迹材料
2014/08/15 职场文书
一份恶作剧的检讨书
2014/09/13 职场文书
党员教师个人对照检查材料范文
2014/09/25 职场文书
综合测评个人总结
2015/03/03 职场文书
医院办公室主任岗位职责
2015/04/01 职场文书
美德少年事迹材料(2016推荐版)
2016/02/25 职场文书
JavaScript流程控制(循环)
2021/12/06 Javascript
Hive导入csv文件示例
2022/06/25 数据库