phpsir 开发 一个检测百度关键字网站排名的python 程序


Posted in Python onSeptember 17, 2009

源码如下 :保存成utf-8 bd.py 文件

#!/usr/bin/env python 
# -*- coding: utf-8 -*- 
import sys 
import urllib ,urllib2 
import re 
def baidu(w): 
url= "http://www.baidu.com/s?" 
values = { 
"w":w.encode('gbk','ignore') 
} 
data = urllib.urlencode(values) 
newurl = url + data 
response = urllib2.urlopen(newurl) 
the_page = response.read().decode('gbk','ignore') 
return the_page def ana(data,mysite): 
o = re.compile("href=\"(.+?)\"") 
f = o.findall(data) 
line = 1 
for ff in f: 
if not re.search("baidu",ff) and not re.search("^s\?",ff) and re.search("^http:\/\/",ff): 
if re.search(mysite,ff): 
print "* " ,line ,ff 
else: 
print line ,ff 
line += 1 
if __name__ == "__main__": 
mysite = sys.argv[2] 
data = baidu(sys.argv[1].decode('utf-8')) 
ana(data,mysite)

用法 python bd.py "关键字" 我的域名部分 :
例:
python bd.py "vbs" "3water.com"
Python 相关文章推荐
从零学python系列之教你如何根据图片生成字符画
May 23 Python
Python的math模块中的常用数学函数整理
Feb 04 Python
Python实现霍夫圆和椭圆变换代码详解
Jan 12 Python
Python实现带参数与不带参数的多重继承示例
Jan 30 Python
Python解决抛小球问题 求小球下落经历的距离之和示例
Feb 01 Python
详解Python下Flask-ApScheduler快速指南
Nov 04 Python
对python判断ip是否可达的实例详解
Jan 31 Python
Django结合ajax进行页面实时更新的例子
Aug 12 Python
keras自定义损失函数并且模型加载的写法介绍
Jun 15 Python
Python自带的IDE在哪里
Jul 01 Python
Python如何创建装饰器时保留函数元信息
Aug 07 Python
Python必备技巧之函数的使用详解
Apr 04 Python
PHP webshell检查工具 python实现代码
Sep 15 #Python
python encode和decode的妙用
Sep 02 #Python
python 简易计算器程序,代码就几行
Aug 29 #Python
python 提取文件的小程序
Jul 29 #Python
Python 文件重命名工具代码
Jul 26 #Python
python 生成目录树及显示文件大小的代码
Jul 23 #Python
python 域名分析工具实现代码
Jul 15 #Python
You might like
深入解析PHP中的(伪)多线程与多进程
2013/07/01 PHP
PHP使用正则表达式实现过滤非法字符串功能示例
2018/06/04 PHP
PHP+ajax实现二级联动菜单功能示例
2018/08/10 PHP
PHP 计算至少是其他数字两倍的最大数的实现代码
2020/05/26 PHP
判断JavaScript对象是否可用的最正确方法分析
2008/10/03 Javascript
JQuery自适应IFrame高度(支持嵌套 兼容IE,ff,safafi,chrome)
2011/03/28 Javascript
javascript和jquery修改a标签的href属性
2013/12/16 Javascript
js使用removeChild方法动态删除div元素
2014/08/01 Javascript
JavaScript动态修改弹出窗口大小的方法
2015/04/06 Javascript
详解javascript获取url信息的常见方法
2016/12/19 Javascript
微信小程序画布圆形进度条显示效果
2020/11/17 Javascript
微信小程序自定义轮播图
2018/11/04 Javascript
JavaScript Array对象使用方法解析
2019/09/24 Javascript
vue-cli3.X快速创建项目的方法步骤
2019/11/14 Javascript
jquery插件懒加载的示例
2020/10/24 jQuery
Python中使用select模块实现非阻塞的IO
2015/02/03 Python
python使用arp欺骗伪造网关的方法
2015/04/24 Python
python实现数组插入新元素的方法
2015/05/22 Python
Python语言描述连续子数组的最大和
2018/01/04 Python
tensorflow 使用flags定义命令行参数的方法
2018/04/23 Python
利用python和百度地图API实现数据地图标注的方法
2019/05/13 Python
Django多数据库的实现过程详解
2019/08/01 Python
python paramiko远程服务器终端操作过程解析
2019/12/14 Python
PyTorch实现更新部分网络,其他不更新
2019/12/31 Python
Python操作Sqlite正确实现方法解析
2020/02/05 Python
完美解决python针对hdfs上传和下载的问题
2020/06/05 Python
Visual Studio code 配置Python开发环境
2020/09/11 Python
利用CSS3的线性渐变linear-gradient制作边框的示例
2016/06/02 HTML / CSS
使用HTML5和CSS3制作一个模态框的示例
2018/03/07 HTML / CSS
网友共享的几个面试题关于Java和Unix等方面的
2016/09/08 面试题
庆祝教师节活动方案
2014/01/31 职场文书
医生个人年度总结
2015/02/28 职场文书
大学生入党自荐书
2015/03/05 职场文书
2019年大学推荐信
2019/06/24 职场文书
Nginx的rewrite模块详解
2021/03/31 Servers
table不让td文字溢出操作方法
2022/12/24 HTML / CSS