python3简单实现微信爬虫


Posted in Python onApril 09, 2015

使用ghost.py 通过搜搜 的微信搜索来爬取微信公共账号的信息

# -*- coding: utf-8 -*-
import sys
reload(sys)
import datetime
import time
sys.setdefaultencoding("utf-8")
 
from ghost import Ghost
ghost = Ghost(wait_timeout=20)
 
url="http://weixin.sogou.com/gzh?openid=oIWsFt8JDv7xubXz5E3U41T0eFbk"
page,resources = ghost.open(url)
result, resources = ghost.wait_for_selector("#wxmore a")
 
from bs4 import BeautifulSoup
c=0
while True:
  if c>=30:
    break
 
  soup = BeautifulSoup(ghost.content)
 
  for wx in soup.find_all("h4"):
    print wx
 
  page, resources = ghost.evaluate(
    """
    var div1 = document.getElementById("wxbox");
    div1.innerHTML = '';
    """)
  ghost.click("#wxmore a")
  result, resources = ghost.wait_for_selector(".wx-rb3")
 
  c=c+1
  pass

以上所述就是本文的全部内容了,希望对大家学习Python能够有所帮助

Python 相关文章推荐
Python多线程编程(六):可重入锁RLock
Apr 05 Python
Python 通过pip安装Django详细介绍
Apr 28 Python
Python字典数据对象拆分的简单实现方法
Dec 05 Python
python实现NB-IoT模块远程控制
Jun 20 Python
获取python的list中含有重复值的index方法
Jun 27 Python
对python当中不在本路径的py文件的引用详解
Dec 15 Python
Python 运行.py文件和交互式运行代码的区别详解
Jul 02 Python
django的ORM操作 增加和查询
Jul 26 Python
复化梯形求积分实例——用Python进行数值计算
Nov 20 Python
opencv+python实现均值滤波
Feb 19 Python
Django使用Celery加redis执行异步任务的实例内容
Feb 20 Python
初步理解Python进程的信号通讯
Apr 09 #Python
详解Python中的多线程编程
Apr 09 #Python
用Python解析XML的几种常见方法的介绍
Apr 09 #Python
在Python中使用pngquant压缩png图片的教程
Apr 09 #Python
python optparse模块使用实例
Apr 09 #Python
Python中处理时间的几种方法小结
Apr 09 #Python
Python CSV模块使用实例
Apr 09 #Python
You might like
php getimagesize 上传图片的长度和宽度检测代码
2010/05/15 PHP
php中json_encode UTF-8中文乱码的更好解决方法
2014/09/28 PHP
php遍历CSV类实例
2015/04/14 PHP
JavaScript高级程序设计 客户端存储学习笔记
2011/09/10 Javascript
javascript实现的弹出层背景置灰-模拟(easyui dialog)
2013/12/27 Javascript
纯css+js写的一个简单的tab标签页带样式
2014/01/28 Javascript
jquery JSON的解析方式示例介绍
2014/07/27 Javascript
分享10个优化代码的CSS和JavaScript工具
2016/05/11 Javascript
酷! 不同风格页面布局幻灯片特效js实现
2021/02/19 Javascript
Centos7 中安装 Node.js v4.4.4
2016/11/03 Javascript
Canvas实现动态的雪花效果
2017/02/13 Javascript
JavaScript实现的搜索及高亮显示功能示例
2017/08/14 Javascript
VUE实现一个分页组件的示例
2017/09/13 Javascript
Vue cli 引入第三方JS和CSS的常用方法分享
2018/01/20 Javascript
vue中各种通信传值方式总结
2019/02/14 Javascript
详解Vue.directive 自定义指令
2019/03/27 Javascript
vue实现购物车结算功能
2020/06/18 Javascript
[01:02:30]Mineski vs Secret 2019国际邀请赛淘汰赛 败者组 BO3 第三场 8.22
2019/09/05 DOTA
Python 的 Socket 编程
2015/03/24 Python
简单上手Python中装饰器的使用
2015/07/12 Python
Python中使用OpenCV库来进行简单的气象学遥感影像计算
2016/02/19 Python
python微信公众号之关注公众号自动回复
2018/10/25 Python
处理Selenium3+python3定位鼠标悬停才显示的元素
2019/07/31 Python
Python+AutoIt实现界面工具开发过程详解
2019/08/07 Python
Python中bisect的使用方法
2019/12/31 Python
python交互模式基础知识点学习
2020/06/18 Python
nohup的用法
2012/11/26 面试题
高校毕业生登记表自我鉴定
2013/11/03 职场文书
公司董事长职责
2013/12/12 职场文书
群众路线批评与自我批评
2014/02/06 职场文书
行政专员的岗位职责
2014/03/10 职场文书
我的画教学反思
2014/04/28 职场文书
村级环境卫生整治方案
2014/05/04 职场文书
大学生简历求职信
2014/06/24 职场文书
2014最新自愿离婚协议书范本
2014/11/19 职场文书
趣味运动会赞词
2015/07/22 职场文书