Python实现获取网站PR及百度权重


Posted in Python onJanuary 21, 2015

访问它,得到Rank_1:1:0。第二个引号后面的数字是PR,因为我的站是没有PR的,所以PR为0.

于是,我们使用requests.get()来访问我们这个构造好的URL,然后获得类似Rank_1:1:0这样的结果,最后通过正则或其他方式得到PR值0。

以上是getPR这个函数的执行过程。再看获取百度权重的过程。

百度权重并不是百度官方给的一个标准,是一些第三方网站计算的一个值,所以并没有像PR一样的接口。所以我们就需要抓取这些第三方网站中的信息了。下面是获取百度权重的函数:

def getBR(www):

    try:

        url = 'http://mytool.chinaz.com/baidusort.aspx?host=%s&sortType=0' % ( www , )

        response = requests.get(url)

        data = response.text

        rex = re.search(r'(<div class="siteinfo">.+?<font.+?>)(\d*?)(</font>)',data,re.I)

        return rex.group(2)

    except :

        return None

使用方法也是传入域名,返回权重值。

我抓取的是站长工具的一个权重咨询的页面:http://mytool.chinaz.com/baidusort.aspx?host={域名}&sortType=0

我的正则就是它:(<div class="siteinfo">.+?<font.+?>)(\d*?)(</font>),大家可以自己查看源代码看一下,就知道正则怎么写了。

好了,我们来批量获取一下这些网站的PR和权重:

Python实现获取网站PR及百度权重

直接看结果:

Python实现获取网站PR及百度权重

单一一个进程扫的话速度会略慢,开10个20个线程批量获取的话应该比较快。

Python 相关文章推荐
Python中pygame的mouse鼠标事件用法实例
Nov 11 Python
使用python装饰器计算函数运行时间的实例
Apr 21 Python
Python实现中一次读取多个值的方法
Apr 22 Python
Python正则表达式和元字符详解
Nov 29 Python
celery4+django2定时任务的实现代码
Dec 23 Python
使用Python刷淘宝喵币(低阶入门版)
Oct 30 Python
使用python快速实现不同机器间文件夹共享方式
Dec 22 Python
谈一谈数组拼接tf.concat()和np.concatenate()的区别
Feb 07 Python
python GUI库图形界面开发之PyQt5复选框控件QCheckBox详细使用方法与实例
Feb 28 Python
在spyder IPython console中,运行代码加入参数的实例
Apr 20 Python
python中的django是做什么的
Jul 31 Python
基于tensorflow __init__、build 和call的使用小结
Feb 26 Python
Python实现抓取页面上链接的简单爬虫分享
Jan 21 #Python
Python中多线程及程序锁浅析
Jan 21 #Python
Python实现的多线程端口扫描工具分享
Jan 21 #Python
Python中的pprint折腾记
Jan 21 #Python
通过C++学习Python
Jan 20 #Python
python入门之语句(if语句、while语句、for语句)
Jan 19 #Python
Python实现删除Android工程中的冗余字符串
Jan 19 #Python
You might like
php实现用户在线时间统计详解
2011/10/08 PHP
一个php生成16位随机数的代码(两种方法)
2014/09/16 PHP
PHP环境中Memcache的安装和使用
2015/11/05 PHP
PHP数组去重比较快的实现方式
2016/01/19 PHP
php+html5实现无刷新图片上传教程
2016/01/22 PHP
WordPress分页伪静态加html后缀
2016/06/08 PHP
Laravel 5.4重新登录实现跳转到登录前页面的原理和方法
2017/07/13 PHP
php微信分享到朋友圈、QQ、朋友、微博
2019/02/18 PHP
用php定义一个数组最简单的方法
2019/10/04 PHP
用php实现分页效果的示例代码
2020/12/10 PHP
javascript String 的扩展方法集合
2008/06/01 Javascript
jQuery 标题的自动翻转实现代码
2009/10/14 Javascript
EXTJS记事本 当CompositeField遇上RowEditor
2011/07/31 Javascript
JavaScript获取onclick、onchange等事件值的代码
2013/07/22 Javascript
JS弹出层的显示与隐藏示例代码
2013/12/27 Javascript
最丑的时钟效果!js canvas时钟制作方法
2016/08/15 Javascript
JSON 数据详解及实例代码分析
2017/01/20 Javascript
微信小程序倒计时功能实现代码
2017/11/09 Javascript
详解react关于事件绑定this的四种方式
2018/03/09 Javascript
javascript中的with语句学习笔记及用法
2020/02/17 Javascript
vue制作抓娃娃机的示例代码
2020/04/17 Javascript
flask框架使用orm连接数据库的方法示例
2018/07/16 Python
matplotlib实现热成像图colorbar和极坐标图的方法
2018/12/13 Python
python tkinter库实现气泡屏保和锁屏
2019/07/29 Python
关于pycharm中pip版本10.0无法使用的解决办法
2019/10/10 Python
Python实现投影法分割图像示例(二)
2020/01/17 Python
python opencv把一张图片嵌入(叠加)到另一张图片上的实现代码
2020/06/11 Python
Oakley官网:运动太阳镜、雪镜和服装
2016/09/30 全球购物
Carter’s OshKosh加拿大:购买婴幼儿服装和童装
2018/11/27 全球购物
Book Depository澳大利亚:世界领先的专业在线书店之一
2018/12/27 全球购物
优秀大学生的自我评价
2014/01/16 职场文书
2014年绩效考核工作总结
2014/12/11 职场文书
补充协议书
2015/01/28 职场文书
关于学习的决心书
2015/02/05 职场文书
安全生产先进个人总结
2015/02/15 职场文书
Python 内置函数速查表一览
2021/06/02 Python