python爬虫 使用真实浏览器打开网页的两种方法总结


Posted in Python onApril 21, 2018

1.使用系统自带库 os

这种方法的优点是,任何浏览器都能够使用, 缺点不能自如的打开一个又一个的网页

import os 
os.system('"C:/Program Files/Internet Explorer/iexplore.exe" http://www.baidu.com')

2.使用python 集成的库 webbroswer

python的webbrowser模块支持对浏览器进行一些操作,主要有以下三个方法:

import webbrowser 
webbrowser.open(url, new=0, autoraise=True) 
webbrowser.open_new(url) 
webbrowser.open_new_tab(url)

他们虽然是三个方法, 其实还是一个方法, 只是传递的参数不同

webbrowser.open(url, new=0, autoraise=True) 在系统的默认浏览器中访问url地址,如果new=0, url会在同一个

浏览器窗口中打开;如果new=1,新的浏览器窗口会被打开;new=2 新的浏览器tab会被打开

其他的两个函数 webbrowser.open_new(url),webbrowser.open_new_tab(url)其实都是返回了webbrowser.open() 这个方法

只是他们没有其他的两个参数了。

在调用其他的浏览器的时候需要提前注册, 否则打开页面的是默认浏览器

import webbrowser 
chromePath = r'你的浏览器目录'   # 例如我的:D:\Google\Chrome\Application\chrome.exe 
webbrowser.register('chrome', None, webbrowser.BackgroundBrowser(chromePath)) #这里的'chrome'可以用其它任意名字,如chrome111,这里将想打开的浏览器保存到'chrome' 
webbrowser.get('chrome').open('www.baidu.com',new=1,autoraise=True)

webbrowser 这个库锁支持的浏览器类型如下:

Type Name Class Name Notes 
 'mozilla' Mozilla('mozilla') 
 'firefox' Mozilla('mozilla') 
 'netscape' Mozilla('netscape') 
 'galeon' Galeon('galeon') 
 'epiphany' Galeon('epiphany') 
 'skipstone' BackgroundBrowser('skipstone') 
 'kfmclient' Konqueror() (1) 
 'konqueror' Konqueror() (1) 
 'kfm' Konqueror() (1) 
 'mosaic' BackgroundBrowser('mosaic') 
 'opera' Opera() 
 'grail' Grail() 
 'links' GenericBrowser('links') 
 'elinks' Elinks('elinks') 
 'lynx' GenericBrowser('lynx') 
 'w3m' GenericBrowser('w3m') 
 'windows-default' WindowsDefault (2) 
 'macosx' MacOSX('default') (3) 
 'safari' MacOSX('safari') (3) 
 'google-chrome' Chrome('google-chrome') 
 'chrome' Chrome('chrome') 
 'chromium' Chromium('chromium') 
 'chromium-browser' Chromium('chromium-browser')

这些内容都可以在 源文件中看到, 路径为: python2.7/libs/webbroser.py

以上这篇python爬虫 使用真实浏览器打开网页的两种方法总结就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
实例讲解Python中global语句下全局变量的值的修改
Jun 16 Python
python读取oracle函数返回值
Jul 18 Python
python读取和保存图片5种方法对比
Sep 12 Python
Python读取Pickle文件信息并计算与当前时间间隔的方法分析
Jan 30 Python
使用celery执行Django串行异步任务的方法步骤
Jun 06 Python
python在新的图片窗口显示图片(图像)的方法
Jul 11 Python
Python字典的概念及常见应用实例详解
Oct 30 Python
Python字典底层实现原理详解
Dec 18 Python
python能否java成为主流语言吗
Jun 22 Python
使用 prometheus python 库编写自定义指标的方法(完整代码)
Jun 29 Python
pycharm 使用tab跳出正在编辑的括号(){}{}等问题
Feb 26 Python
Python爬虫实战之爬取携程评论
Jun 02 Python
Python针对给定字符串求解所有子序列是否为回文序列的方法
Apr 21 #Python
Django项目实战之用户头像上传与访问的示例
Apr 21 #Python
基于Python 装饰器装饰类中的方法实例
Apr 21 #Python
使用python装饰器计算函数运行时间的实例
Apr 21 #Python
Python实现针对给定字符串寻找最长非重复子串的方法
Apr 21 #Python
Python 实现一行输入多个值的方法
Apr 21 #Python
Python实现接受任意个数参数的函数方法
Apr 21 #Python
You might like
YII中Ueditor富文本编辑器文件和图片上传的配置图文教程
2017/03/15 PHP
JavaScript.Encode手动解码技巧
2010/07/14 Javascript
Javascript读取cookie函数代码
2010/10/16 Javascript
判断JS对象是否拥有某属性的方法推荐
2016/05/12 Javascript
JS去除字符串中空格的方法
2017/02/14 Javascript
Bootstrap栅格系统简单实现代码
2017/03/06 Javascript
浅谈node的事件机制
2017/10/09 Javascript
react同构实践之实现自己的同构模板
2019/03/13 Javascript
vue 表单之通过v-model绑定单选按钮radio
2019/05/13 Javascript
[02:06]DOTA2肉山黑名单魔法终结者 敌法师中文配音鉴赏
2013/06/17 DOTA
Python类的专用方法实例分析
2015/01/09 Python
python中反射用法实例
2015/03/27 Python
python魔法方法-属性转换和类的表示详解
2016/07/22 Python
解决pandas中读取中文名称的csv文件报错的问题
2018/07/04 Python
Flask框架通过Flask_login实现用户登录功能示例
2018/07/17 Python
Python把对应格式的csv文件转换成字典类型存储脚本的方法
2019/02/12 Python
Python实现通过解析域名获取ip地址的方法分析
2019/05/17 Python
python matplotlib库绘制散点图例题解析
2019/08/10 Python
pytorch 在sequential中使用view来reshape的例子
2019/08/20 Python
python绘制玫瑰的实现代码
2020/03/02 Python
三步解决python PermissionError: [WinError 5]拒绝访问的情况
2020/04/22 Python
Django serializer优化类视图的实现示例
2020/07/16 Python
法国房车租赁网站:Yescapa
2019/08/26 全球购物
初中生学习的自我评价
2013/11/14 职场文书
区域销售经理岗位职责
2013/12/10 职场文书
企业宣传方案
2014/03/04 职场文书
应届生求职信
2014/05/31 职场文书
2014年四风问题自我剖析材料
2014/09/15 职场文书
陕西导游词
2015/02/04 职场文书
劳动仲裁代理词范文
2015/05/25 职场文书
追讨欠款律师函
2015/06/24 职场文书
2019职场实习报告该怎么写?
2019/07/01 职场文书
老生常谈 使用 CSS 实现三角形的技巧(多种方法)
2021/04/13 HTML / CSS
《雀魂PONG☆》4月1日播出 PV角色设定情报
2022/03/20 日漫
Mysql如何实现不存在则插入,存在则更新
2022/03/25 MySQL
Pillow图像处理库安装及使用
2022/04/12 Python