python3简单实现微信爬虫


Posted in Python onApril 09, 2015

使用ghost.py 通过搜搜 的微信搜索来爬取微信公共账号的信息

# -*- coding: utf-8 -*-
import sys
reload(sys)
import datetime
import time
sys.setdefaultencoding("utf-8")
 
from ghost import Ghost
ghost = Ghost(wait_timeout=20)
 
url="http://weixin.sogou.com/gzh?openid=oIWsFt8JDv7xubXz5E3U41T0eFbk"
page,resources = ghost.open(url)
result, resources = ghost.wait_for_selector("#wxmore a")
 
from bs4 import BeautifulSoup
c=0
while True:
  if c>=30:
    break
 
  soup = BeautifulSoup(ghost.content)
 
  for wx in soup.find_all("h4"):
    print wx
 
  page, resources = ghost.evaluate(
    """
    var div1 = document.getElementById("wxbox");
    div1.innerHTML = '';
    """)
  ghost.click("#wxmore a")
  result, resources = ghost.wait_for_selector(".wx-rb3")
 
  c=c+1
  pass

以上所述就是本文的全部内容了,希望对大家学习Python能够有所帮助

Python 相关文章推荐
分析Python中解析构建数据知识
Jan 20 Python
Python3 利用requests 库进行post携带账号密码请求数据的方法
Oct 26 Python
对pytorch网络层结构的数组化详解
Dec 08 Python
对python中词典的values值的修改或新增KEY详解
Jan 20 Python
Python基本数据结构之字典类型dict用法分析
Jun 08 Python
pybind11和numpy进行交互的方法
Jul 04 Python
Python语言异常处理测试过程解析
Jan 08 Python
python图形界面开发之wxPython树控件使用方法详解
Feb 24 Python
使用Django xadmin 实现修改时间选择器为不可输入状态
Mar 30 Python
Django def clean()函数对表单中的数据进行验证操作
Jul 09 Python
如何使用 Flask 做一个评论系统
Nov 27 Python
python之django路由和视图案例教程
Jul 26 Python
初步理解Python进程的信号通讯
Apr 09 #Python
详解Python中的多线程编程
Apr 09 #Python
用Python解析XML的几种常见方法的介绍
Apr 09 #Python
在Python中使用pngquant压缩png图片的教程
Apr 09 #Python
python optparse模块使用实例
Apr 09 #Python
Python中处理时间的几种方法小结
Apr 09 #Python
Python CSV模块使用实例
Apr 09 #Python
You might like
实测在class的function中include的文件中非php的global全局环境
2013/07/15 PHP
Thinkphp中的volist标签用法简介
2014/06/18 PHP
Zend Framework教程之Application用法实例详解
2016/03/14 PHP
实现超用户体验 table排序javascript实现代码
2009/06/22 Javascript
jquery.fileEveryWhere.js 一个跨浏览器的file显示插件
2011/10/24 Javascript
轻松创建nodejs服务器(2):nodejs服务器的构成分析
2014/12/18 NodeJs
基于jQuery实现仿百度首页选项卡切换效果
2016/05/29 Javascript
Node.js配合node-http-proxy解决本地开发ajax跨域问题
2016/08/31 Javascript
JavaScript数组的5种迭代方法
2017/09/29 Javascript
vue中简单弹框dialog的实现方法
2018/02/26 Javascript
vue.js的双向数据绑定Object.defineProperty方法的神奇之处
2019/01/18 Javascript
[10:07]2014DOTA2国际邀请赛 实拍选手现场观战DK对阵Titan
2014/07/12 DOTA
[01:33]PWL开团时刻DAY2-开雾与反开雾
2020/10/31 DOTA
跟老齐学Python之集合的关系
2014/09/24 Python
R vs. Python 数据分析中谁与争锋?
2017/10/18 Python
用python生成1000个txt文件的方法
2018/10/25 Python
解决pyinstaller打包pyqt5的问题
2019/01/08 Python
python实现弹窗祝福效果
2019/04/07 Python
Python列表(list)所有元素的同一操作解析
2019/08/01 Python
浅谈Tensorflow加载Vgg预训练模型的几个注意事项
2020/05/26 Python
numpy实现RNN原理实现
2021/03/02 Python
佳能英国官方网站:Canon UK
2017/08/08 全球购物
SkinCeuticals官网:美国药妆品牌
2018/04/19 全球购物
法国一家多品牌成衣精品中/高档商店:Graduate Store
2019/08/28 全球购物
实习评语
2013/12/16 职场文书
项目计划书范文
2014/01/09 职场文书
部队领导证婚词
2014/01/12 职场文书
中秋节礼品促销方案
2014/02/02 职场文书
《歌唱二小放牛郎》教学反思
2014/04/19 职场文书
考试后的感想
2015/08/07 职场文书
中考百日冲刺决心书
2015/09/22 职场文书
小学语文继续教育研修日志
2015/11/13 职场文书
Windows10下安装MySQL8
2021/04/06 MySQL
PHP实现rar解压读取扩展包小结
2021/06/03 PHP
解决Mysql多行子查询的使用及空值问题
2022/01/22 MySQL
铁拳制作人赞《铁拳7》老头环Mod:制作精良 但别弄了
2022/04/03 其他游戏