编程 Python

python3简单实现微信爬虫

Posted in Python onApril 09, 2015

使用ghost.py 通过搜搜的微信搜索来爬取微信公共账号的信息

# -*- coding: utf-8 -*-
import sys
reload(sys)
import datetime
import time
sys.setdefaultencoding("utf-8")
 
from ghost import Ghost
ghost = Ghost(wait_timeout=20)
 
url="http://weixin.sogou.com/gzh?openid=oIWsFt8JDv7xubXz5E3U41T0eFbk"
page,resources = ghost.open(url)
result, resources = ghost.wait_for_selector("#wxmore a")
 
from bs4 import BeautifulSoup
c=0
while True:
  if c>=30:
    break
 
  soup = BeautifulSoup(ghost.content)
 
  for wx in soup.find_all("h4"):
    print wx
 
  page, resources = ghost.evaluate(
    """
    var div1 = document.getElementById("wxbox");
    div1.innerHTML = '';
    """)
  ghost.click("#wxmore a")
  result, resources = ghost.wait_for_selector(".wx-rb3")
 
  c=c+1
  pass

以上所述就是本文的全部内容了，希望对大家学习Python能够有所帮助

python3简单实现微信爬虫

- Author -

hebedich

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

探究Python中isalnum()方法的使用

May 18 Python

python简单实现刷新智联简历

Mar 30 Python

Python中的Descriptor描述符学习教程

Jun 02 Python

python框架django基础指南

Sep 08 Python

python中numpy包使用教程之数组和相关操作详解

Jul 30 Python

Python实现的txt文件去重功能示例

Jul 07 Python

Python实现多线程/多进程的TCP服务器

Sep 03 Python

QML使用Python的函数过程解析

Sep 26 Python

python3.8与pyinstaller冲突问题的快速解决方法

Jan 16 Python

python+requests实现接口测试的完整步骤

Oct 27 Python

python迷宫问题深度优先遍历实例

Jun 20 Python

Python+Selenium实现读取网易邮箱验证码

Mar 13 Python

初步理解Python进程的信号通讯

Apr 09 #Python

详解Python中的多线程编程

Apr 09 #Python

用Python解析XML的几种常见方法的介绍

Apr 09 #Python

在Python中使用pngquant压缩png图片的教程

Apr 09 #Python

python optparse模块使用实例

Apr 09 #Python

Python中处理时间的几种方法小结

Apr 09 #Python

Python CSV模块使用实例

Apr 09 #Python

You might like

DOTA2 1月28日更新：监管系统降临刀塔世界

2021/01/28 DOTA

PHP 常用函数库和一些实用小技巧

2009/01/01 PHP

php 将bmp图片转为jpg等其他任意格式的图片

2009/06/29 PHP

php实现发送微信模板消息的方法

2015/03/07 PHP

纯JS实现的批量图片预览加载功能

2011/08/14 Javascript

JS解析json数据并将json字符串转化为数组的实现方法

2012/12/25 Javascript

php 中序列化和json使用介绍

2013/07/08 Javascript

jQuery实现带有动画效果的回到顶部和底部代码

2015/11/04 Javascript

一道关于JavaScript变量作用域的面试题

2016/03/08 Javascript

一个用jquery写的判断div滚动条到底部的方法【推荐】

2016/04/29 Javascript

ES6 Promise对象概念与用法分析

2017/04/01 Javascript

Bootstrap弹出框之自定义悬停框标题、内容和样式示例代码

2017/07/11 Javascript

详解js静态资源文件请求的处理

2017/08/01 Javascript

vue服务端渲染页面缓存和组件缓存的实例详解

2018/09/18 Javascript

JavaScript实现随机五位数验证码

2019/09/27 Javascript

javascript将16进制的字符串转换为10进制整数hex

2020/03/05 Javascript

探索浏览器页面关闭window.close()的使用详解

2020/08/21 Javascript

Python实现基于权重的随机数2种方法

2015/04/28 Python

在Python中使用mechanize模块模拟浏览器功能

2015/05/05 Python

Python中max函数用法实例分析

2015/07/17 Python

详解分布式任务队列Celery使用说明

2018/11/29 Python

Python3实现获取图片文字里中文的方法分析

2018/12/13 Python

如何使用html5与css3完成google涂鸦动画

2012/12/16 HTML / CSS

英格兰橄榄球商店：England Rugby Store

2016/12/17 全球购物

利物浦足球俱乐部官方网上商店：Liverpool FC Official Store

2018/01/13 全球购物

Sneaker Studio乌克兰：购买运动鞋

2018/03/26 全球购物

Shopee越南：东南亚与台湾电商平台

2019/02/03 全球购物

英国顶尖手表珠宝品牌独家授权经销商：HS Johnson

2020/10/28 全球购物

寒假实习自荐信

2014/01/26 职场文书

汽车维修工岗位职责

2014/02/12 职场文书

电气自动化专业职业规划范文

2014/02/16 职场文书

奠基仪式主持词

2014/03/20 职场文书

岗位说明书范文

2014/05/07 职场文书

一般党员对照检查材料

2014/09/24 职场文书

关于战胜挫折的名言警句大全！

2019/07/05 职场文书

mybatis中sql语句CDATA标签的用法说明

2021/06/30 Java/Android