python3简单实现微信爬虫


Posted in Python onApril 09, 2015

使用ghost.py 通过搜搜 的微信搜索来爬取微信公共账号的信息

# -*- coding: utf-8 -*-
import sys
reload(sys)
import datetime
import time
sys.setdefaultencoding("utf-8")
 
from ghost import Ghost
ghost = Ghost(wait_timeout=20)
 
url="http://weixin.sogou.com/gzh?openid=oIWsFt8JDv7xubXz5E3U41T0eFbk"
page,resources = ghost.open(url)
result, resources = ghost.wait_for_selector("#wxmore a")
 
from bs4 import BeautifulSoup
c=0
while True:
  if c>=30:
    break
 
  soup = BeautifulSoup(ghost.content)
 
  for wx in soup.find_all("h4"):
    print wx
 
  page, resources = ghost.evaluate(
    """
    var div1 = document.getElementById("wxbox");
    div1.innerHTML = '';
    """)
  ghost.click("#wxmore a")
  result, resources = ghost.wait_for_selector(".wx-rb3")
 
  c=c+1
  pass

以上所述就是本文的全部内容了,希望对大家学习Python能够有所帮助

Python 相关文章推荐
python base64 decode incorrect padding错误解决方法
Jan 08 Python
python的mysqldb安装步骤详解
Aug 14 Python
Python自定义简单图轴简单实例
Jan 08 Python
Python之ReportLab绘制条形码和二维码的实例
Jan 15 Python
浅谈pycharm的xmx和xms设置方法
Dec 03 Python
Python Django 页面上展示固定的页码数实现代码
Aug 21 Python
Python Django实现layui风格+django分页功能的例子
Aug 29 Python
flask 实现token机制的示例代码
Nov 07 Python
浅谈keras中loss与val_loss的关系
Jun 22 Python
聊聊python中的异常嵌套
Sep 01 Python
OpenCV利用python来实现图像的直方图均衡化
Oct 21 Python
Python办公自动化PPT批量转换操作
Sep 15 Python
初步理解Python进程的信号通讯
Apr 09 #Python
详解Python中的多线程编程
Apr 09 #Python
用Python解析XML的几种常见方法的介绍
Apr 09 #Python
在Python中使用pngquant压缩png图片的教程
Apr 09 #Python
python optparse模块使用实例
Apr 09 #Python
Python中处理时间的几种方法小结
Apr 09 #Python
Python CSV模块使用实例
Apr 09 #Python
You might like
PHP定时任务获取微信access_token的方法
2016/10/10 PHP
PHP使用ActiveMQ实现消息队列的方法详解
2019/05/31 PHP
JavaScript去除空格的几种方法
2006/10/03 Javascript
javascript动画之圆形运动,环绕鼠标运动作小球
2010/07/20 Javascript
33个优秀的jQuery 教程分享(幻灯片、动画菜单)
2011/07/08 Javascript
检测input每次的输入是否合法遇到汉字输入就有问题
2012/05/23 Javascript
JQuery入门—JQuery程序的代码风格详细介绍
2013/01/03 Javascript
offsetHeight在OnLoad中获取为0的现象
2013/07/22 Javascript
手机号码,密码正则验证
2014/09/04 Javascript
JavaScript实现网页加载进度条代码超简单
2015/09/21 Javascript
简介AngularJS中$http服务的用法
2016/02/06 Javascript
Bootstrap 折叠(Collapse)插件用法实例详解
2016/06/01 Javascript
js判断某个字符出现的次数的简单实例
2016/06/03 Javascript
JS HTML5实现拖拽移动列表效果
2020/08/27 Javascript
多种方式实现js图片预览
2016/12/12 Javascript
Node.js连接MongoDB数据库产生的问题
2017/02/08 Javascript
解决jquery appaend元素中id绑定事件失效的问题
2017/09/12 jQuery
JavaScript适配器模式详解
2017/10/19 Javascript
vue 实现剪裁图片并上传服务器功能
2018/03/01 Javascript
在vue-cli项目中使用bootstrap的方法示例
2018/04/21 Javascript
javascript删除数组元素的七个方法示例
2019/09/09 Javascript
Vue父子之间值传递的实例教程
2020/07/02 Javascript
python中的hashlib和base64加密模块使用实例
2014/09/02 Python
Python 冒泡,选择,插入排序使用实例
2015/02/05 Python
让Python代码更快运行的5种方法
2015/06/21 Python
python字符串查找函数的用法详解
2019/07/08 Python
PyCharm无法引用自身项目解决方式
2020/02/12 Python
Python实现王者荣耀自动刷金币的完整步骤
2021/01/22 Python
css3实现元素环绕中心点布局的方法示例
2019/01/15 HTML / CSS
html5中JavaScript removeChild 删除所有节点
2014/05/16 HTML / CSS
应届毕业生应聘自荐信范文
2014/02/26 职场文书
初中信息技术教学反思
2016/02/16 职场文书
2016年少先队活动总结
2016/04/06 职场文书
推荐六本经典文学奖书籍:此生必读
2019/08/22 职场文书
python爬虫请求库httpx和parsel解析库的使用测评
2021/05/10 Python
解决Python中的modf()函数取小数部分不准确问题
2021/05/28 Python