Python实现的爬虫刷回复功能示例


Posted in Python onJune 07, 2018

本文实例讲述了Python实现的爬虫刷回复功能。分享给大家供大家参考,具体如下:

最近闲的无聊,就想着去看看爬虫,顺着爬虫顺利的做到了模拟登录、刷帖子等等,这里简要说一下。

使用Python2.7写的爬虫,对某论坛做模拟登陆和刷帖子、回复等等,由于之前是没有接触过爬虫,这次之后感觉爬虫很强大,能做很多事,先来贴几张图。

Python实现的爬虫刷回复功能示例

由于论坛不让使用相同的文字,所以调用了笑话的api,达到不同文字的目的。

该论坛使用的是cookie,所以先去获取一下cookie,顺便将cookie写到文件里面。

'''
获取cookie
'''
def get_cookie(login_data, url, testurl=None):
  filename = "cookie"
  cookie = cookielib.MozillaCookieJar(filename)
  hadler = urllib2.HTTPCookieProcessor(cookie)
  opener = urllib2.build_opener(hadler)
  post_data = urllib.urlencode(
    {'logname': 123456, "logpass": "123456", "action": "login", })
  url = 'http://*****.me/waplogin.aspx'
  opener.open(url, post_data)
  cookie.save(ignore_discard=True, ignore_expires=True)
  print("获取成功")
  # print(opener.open(testurl).read())

先要分析该网站登录地址,登录需要的参数,如上代码

获得cookie之后,分析该论坛的回复参数,该论坛采用的是post提交,需要有帖子id,回复内容等等,分析之后得到如下代码

代码先加载文件里面的cookie,然后调用了haha这个笑话api,当然我已经将这个api的json进行了处理,这里只要笑话内容就行。

'''
回复帖子
'''
def post_reply():
  filename = "cookie"
  cookie = cookielib.MozillaCookieJar(filename)
  cookie.load(filename, ignore_discard=True, ignore_expires=True)
  handler = urllib2.HTTPCookieProcessor(cookie)
  opener = urllib2.build_opener(handler)
  num=0
  for i in range(216255, 800000):
    num = num + 1
    huifu = urllib.urlencode(
      {'sendmsg': 0, "content": str(haha(num)), "action": "add", "id": str(i), "classid": 177})
    gradeUrl = 'http://******.me/bbs/book_re.aspx'
    result = opener.open(gradeUrl)
    print result.read()
    print "当前第" + str(num) + "" + "次回帖"
    print("当前帖子id" + str(i))
    sleep(1)

发帖子代码:

'''
发帖子(普通帖子或者加悬赏分的帖子:并不是悬赏板块的帖子)
'''
def post_articles(book_title, book_content, classid=177, sendmoney=0):
  filename = "cookie"
  cookie = cookielib.MozillaCookieJar(filename)
  cookie.load(filename, ignore_discard=True, ignore_expires=True)
  handler = urllib2.HTTPCookieProcessor(cookie)
  opener = urllib2.build_opener(handler)
  post_articles = urllib.urlencode(
    {'sendmsg': 0, "book_title": str(book_title), "action": "gomod", "siteid": "1000",
     "book_content": str(book_content), "classid": classid, "sendmoney": sendmoney})
  gradeUrl = 'http://*****.me/bbs/book_view_add.aspx'
  result = opener.open(gradeUrl, post_articles)
  print(result.read())

将这些代码进行进行调用就可以去刷回复了。

Python实现的爬虫刷回复功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
零基础写python爬虫之爬虫的定义及URL构成
Nov 04 Python
python计算时间差的方法
May 20 Python
实例讲解Python中函数的调用与定义
Mar 14 Python
python编程培训 python培训靠谱吗
Jan 17 Python
python发送告警邮件脚本
Sep 17 Python
influx+grafana自定义python采集数据和一些坑的总结
Sep 17 Python
Python中单线程、多线程和多进程的效率对比实验实例
May 14 Python
详解Python Qt的窗体开发的基本操作
Jul 14 Python
python的range和linspace使用详解
Nov 27 Python
python 浮点数四舍五入需要注意的地方
Aug 18 Python
协程Python 中实现多任务耗资源最小的方式
Oct 19 Python
在NumPy中深拷贝和浅拷贝相关操作的定义和背后的原理
Apr 14 Python
异步任务队列Celery在Django中的使用方法
Jun 07 #Python
浅谈python中对于json写入txt文件的编码问题
Jun 07 #Python
Python查看微信撤回消息代码
Jun 07 #Python
spark: RDD与DataFrame之间的相互转换方法
Jun 07 #Python
Python简单实现网页内容抓取功能示例
Jun 07 #Python
pyspark 读取csv文件创建DataFrame的两种方法
Jun 07 #Python
redis之django-redis的简单缓存使用
Jun 07 #Python
You might like
基于PHP Socket配置以及实例的详细介绍
2013/06/13 PHP
微信API接口大全
2015/04/15 PHP
PHP实现通过get方式识别用户发送邮件的方法
2015/07/16 PHP
PHP使用星号替代用户名手机和邮箱的实现代码
2018/02/07 PHP
PHP架构及原理知识点详解
2019/12/22 PHP
JavaScript中的View-Model使用介绍
2011/08/11 Javascript
基于jquery实现点击左右按钮图片横向滚动
2013/04/11 Javascript
jquery快捷动态绑定键盘事件的操作函数代码
2013/10/17 Javascript
node.js中的fs.lchmodSync方法使用说明
2014/12/16 Javascript
js实现select选择框效果及美化
2016/08/19 Javascript
nodejs中模块定义实例详解
2017/03/18 NodeJs
Angular2下使用pdf插件的方法详解
2017/04/29 Javascript
深入理解vue Render函数
2017/07/19 Javascript
JavaScript实现各种排序的代码详解
2017/08/28 Javascript
js实现淘宝首页的banner栏效果
2019/11/26 Javascript
JavaScript面向对象核心知识与概念归纳整理
2020/05/09 Javascript
[34:44]Liquid vs TNC Supermajor 胜者组 BO3 第二场 6.4
2018/06/05 DOTA
Python使用urllib2模块抓取HTML页面资源的实例分享
2016/05/03 Python
python变量不能以数字打头详解
2016/07/06 Python
Python3简单爬虫抓取网页图片代码实例
2019/08/26 Python
基于python全局设置id 自动化测试元素定位过程解析
2019/09/04 Python
python pptx复制指定页的ppt教程
2020/02/14 Python
Python中import导入不同目录的模块方法详解
2020/02/18 Python
如何基于Python实现word文档重新排版
2020/09/29 Python
python 生成器需注意的小问题
2020/09/29 Python
英国羊绒服装购物网站:Pure Collection
2018/10/22 全球购物
全球性的在线商店:Vogca
2019/05/10 全球购物
同步和异步有何异同,在什么情况下分别使用他们
2013/04/09 面试题
学员自我鉴定
2014/03/19 职场文书
小学校园文化建设汇报材料
2014/08/19 职场文书
小学生十佳少年事迹材料
2014/08/20 职场文书
党支部三严三实对照检查材料思想汇报
2014/09/29 职场文书
2014年项目工作总结
2014/11/24 职场文书
2015年禁毒工作总结
2015/04/30 职场文书
建筑工程催款函
2015/06/24 职场文书
Python实现视频自动打码的示例代码
2022/04/08 Python