python3简单实现微信爬虫


Posted in Python onApril 09, 2015

使用ghost.py 通过搜搜 的微信搜索来爬取微信公共账号的信息

# -*- coding: utf-8 -*-
import sys
reload(sys)
import datetime
import time
sys.setdefaultencoding("utf-8")
 
from ghost import Ghost
ghost = Ghost(wait_timeout=20)
 
url="http://weixin.sogou.com/gzh?openid=oIWsFt8JDv7xubXz5E3U41T0eFbk"
page,resources = ghost.open(url)
result, resources = ghost.wait_for_selector("#wxmore a")
 
from bs4 import BeautifulSoup
c=0
while True:
  if c>=30:
    break
 
  soup = BeautifulSoup(ghost.content)
 
  for wx in soup.find_all("h4"):
    print wx
 
  page, resources = ghost.evaluate(
    """
    var div1 = document.getElementById("wxbox");
    div1.innerHTML = '';
    """)
  ghost.click("#wxmore a")
  result, resources = ghost.wait_for_selector(".wx-rb3")
 
  c=c+1
  pass

以上所述就是本文的全部内容了,希望对大家学习Python能够有所帮助

Python 相关文章推荐
探究Python中isalnum()方法的使用
May 18 Python
python简单实现刷新智联简历
Mar 30 Python
Python中的Descriptor描述符学习教程
Jun 02 Python
python框架django基础指南
Sep 08 Python
python中numpy包使用教程之数组和相关操作详解
Jul 30 Python
Python实现的txt文件去重功能示例
Jul 07 Python
Python实现多线程/多进程的TCP服务器
Sep 03 Python
QML使用Python的函数过程解析
Sep 26 Python
python3.8与pyinstaller冲突问题的快速解决方法
Jan 16 Python
python+requests实现接口测试的完整步骤
Oct 27 Python
python迷宫问题深度优先遍历实例
Jun 20 Python
Python+Selenium实现读取网易邮箱验证码
Mar 13 Python
初步理解Python进程的信号通讯
Apr 09 #Python
详解Python中的多线程编程
Apr 09 #Python
用Python解析XML的几种常见方法的介绍
Apr 09 #Python
在Python中使用pngquant压缩png图片的教程
Apr 09 #Python
python optparse模块使用实例
Apr 09 #Python
Python中处理时间的几种方法小结
Apr 09 #Python
Python CSV模块使用实例
Apr 09 #Python
You might like
DOTA2 1月28日更新:监管系统降临刀塔世界
2021/01/28 DOTA
PHP 常用函数库和一些实用小技巧
2009/01/01 PHP
php 将bmp图片转为jpg等其他任意格式的图片
2009/06/29 PHP
php实现发送微信模板消息的方法
2015/03/07 PHP
纯JS实现的批量图片预览加载功能
2011/08/14 Javascript
JS解析json数据并将json字符串转化为数组的实现方法
2012/12/25 Javascript
php 中序列化和json使用介绍
2013/07/08 Javascript
jQuery实现带有动画效果的回到顶部和底部代码
2015/11/04 Javascript
一道关于JavaScript变量作用域的面试题
2016/03/08 Javascript
一个用jquery写的判断div滚动条到底部的方法【推荐】
2016/04/29 Javascript
ES6 Promise对象概念与用法分析
2017/04/01 Javascript
Bootstrap弹出框之自定义悬停框标题、内容和样式示例代码
2017/07/11 Javascript
详解js静态资源文件请求的处理
2017/08/01 Javascript
vue服务端渲染页面缓存和组件缓存的实例详解
2018/09/18 Javascript
JavaScript实现随机五位数验证码
2019/09/27 Javascript
javascript将16进制的字符串转换为10进制整数hex
2020/03/05 Javascript
探索浏览器页面关闭window.close()的使用详解
2020/08/21 Javascript
Python实现基于权重的随机数2种方法
2015/04/28 Python
在Python中使用mechanize模块模拟浏览器功能
2015/05/05 Python
Python中max函数用法实例分析
2015/07/17 Python
详解分布式任务队列Celery使用说明
2018/11/29 Python
Python3实现获取图片文字里中文的方法分析
2018/12/13 Python
如何使用html5与css3完成google涂鸦动画
2012/12/16 HTML / CSS
英格兰橄榄球商店:England Rugby Store
2016/12/17 全球购物
利物浦足球俱乐部官方网上商店:Liverpool FC Official Store
2018/01/13 全球购物
Sneaker Studio乌克兰:购买运动鞋
2018/03/26 全球购物
Shopee越南:东南亚与台湾电商平台
2019/02/03 全球购物
英国顶尖手表珠宝品牌独家授权经销商:HS Johnson
2020/10/28 全球购物
寒假实习自荐信
2014/01/26 职场文书
汽车维修工岗位职责
2014/02/12 职场文书
电气自动化专业职业规划范文
2014/02/16 职场文书
奠基仪式主持词
2014/03/20 职场文书
岗位说明书范文
2014/05/07 职场文书
一般党员对照检查材料
2014/09/24 职场文书
关于战胜挫折的名言警句大全!
2019/07/05 职场文书
mybatis中sql语句CDATA标签的用法说明
2021/06/30 Java/Android