python3简单实现微信爬虫


Posted in Python onApril 09, 2015

使用ghost.py 通过搜搜 的微信搜索来爬取微信公共账号的信息

# -*- coding: utf-8 -*-
import sys
reload(sys)
import datetime
import time
sys.setdefaultencoding("utf-8")
 
from ghost import Ghost
ghost = Ghost(wait_timeout=20)
 
url="http://weixin.sogou.com/gzh?openid=oIWsFt8JDv7xubXz5E3U41T0eFbk"
page,resources = ghost.open(url)
result, resources = ghost.wait_for_selector("#wxmore a")
 
from bs4 import BeautifulSoup
c=0
while True:
  if c>=30:
    break
 
  soup = BeautifulSoup(ghost.content)
 
  for wx in soup.find_all("h4"):
    print wx
 
  page, resources = ghost.evaluate(
    """
    var div1 = document.getElementById("wxbox");
    div1.innerHTML = '';
    """)
  ghost.click("#wxmore a")
  result, resources = ghost.wait_for_selector(".wx-rb3")
 
  c=c+1
  pass

以上所述就是本文的全部内容了,希望对大家学习Python能够有所帮助

Python 相关文章推荐
Python获取Linux系统下的本机IP地址代码分享
Nov 07 Python
python编写微信远程控制电脑的程序
Jan 05 Python
对python 多个分隔符split 的实例详解
Dec 20 Python
Apache部署Django项目图文详解
Jul 30 Python
Tensorflow 多线程与多进程数据加载实例
Feb 05 Python
python实现堆排序的实例讲解
Feb 21 Python
Tensorflow中的dropout的使用方法
Mar 13 Python
python手机号前7位归属地爬虫代码实例
Mar 31 Python
Python中读取文件名中的数字的实例详解
Dec 25 Python
Python数据模型与Python对象模型的相关总结
Jan 26 Python
python 中yaml文件用法大全
Jul 04 Python
详解Python+OpenCV绘制灰度直方图
Mar 22 Python
初步理解Python进程的信号通讯
Apr 09 #Python
详解Python中的多线程编程
Apr 09 #Python
用Python解析XML的几种常见方法的介绍
Apr 09 #Python
在Python中使用pngquant压缩png图片的教程
Apr 09 #Python
python optparse模块使用实例
Apr 09 #Python
Python中处理时间的几种方法小结
Apr 09 #Python
Python CSV模块使用实例
Apr 09 #Python
You might like
php实现utf-8和GB2312编码相互转换函数代码
2013/02/07 PHP
使用phpQuery采集网页的方法
2013/11/13 PHP
PHP新建类问题分析及解决思路
2015/11/19 PHP
PHP getallheaders无法获取自定义头(headers)的问题
2016/03/23 PHP
PHP+Ajax+JS实现多图上传
2016/05/07 PHP
PHP abstract 抽象类定义与用法示例
2018/05/29 PHP
jQuery maxlength文本字数限制插件
2010/04/16 Javascript
关于div自适应高度/左右高度自适应一致的js代码
2013/03/22 Javascript
如何从jQuery的ajax请求中删除X-Requested-With
2013/12/11 Javascript
常用的JavaScript WEB操作方法分享
2015/02/28 Javascript
js立即执行函数: (function ( ){})( ) 与 (function ( ){}( )) 有什么区别?
2015/11/18 Javascript
【JS+CSS3】实现带预览图幻灯片效果的示例代码
2016/03/17 Javascript
Bootstrap教程JS插件滚动监听学习笔记分享
2016/05/18 Javascript
ThinkJS中如何使用MongoDB的CURD操作
2016/12/13 Javascript
vue.js中mint-ui框架的使用方法
2017/05/12 Javascript
浅谈Node.js ORM框架Sequlize之表间关系
2017/07/24 Javascript
微信小程序实现animation动画
2018/01/26 Javascript
js中的闭包学习心得
2018/02/06 Javascript
vue利用v-for嵌套输出多层对象,分别输出到个表的方法
2018/09/07 Javascript
vue flex 布局实现div均分自动换行的示例代码
2020/08/05 Javascript
js实现类选择器和name属性选择器的示例步骤
2021/02/07 Javascript
python人民币小写转大写辅助工具
2018/06/20 Python
详解安装mitmproxy以及遇到的坑和简单用法
2019/01/21 Python
python3读取图片并灰度化图片的四种方法(OpenCV、PIL.Image、TensorFlow方法)总结
2019/07/04 Python
python3.6 tkinter实现屏保小程序
2019/07/30 Python
pyinstaller打包opencv和numpy程序运行错误解决
2019/08/16 Python
Numpy 中的矩阵求逆实例
2019/08/26 Python
使用Fabric自动化部署Django项目的实现
2019/09/27 Python
HTML5新特性 多线程(Worker SharedWorker)
2017/04/24 HTML / CSS
MaBelle玛贝尔香港官网:香港钻饰连锁店
2019/09/09 全球购物
Skechers越南官方网站:来自美国的运动休闲品牌
2021/02/22 全球购物
行政经理岗位职责
2013/11/09 职场文书
幼儿园六一儿童节演讲稿
2015/03/19 职场文书
大国崛起英国观后感
2015/06/02 职场文书
房屋所有权证明
2015/06/19 职场文书
Java实现多线程聊天室
2021/06/26 Java/Android