python requests抓取one推送文字和图片代码实例


Posted in Python onNovember 04, 2019

这篇文章主要介绍了python requests抓取one推送文字和图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

requests是Python中一个第三方库,基于 urllib,采用 Apache2 Licensed 开源协议的 HTTP 库。它比 urllib 更加方便,可以节约我们大量的工作,完全满足 HTTP 测试需求。接下来将记录一下requests的使用:

from bs4 import BeautifulSoup
from lxml import html
import xml
import requests

#下载图片函数
def download_img(url,name):
  """"
  下载指定url的图片
  url:图片的url;
  name:保存图片的名字
  """
  try:
    respone = requests.get(url)
    f_img = respone.content
    path = r'C:\Users\86131\Desktop\itchat\send_file\images\\%s.jpg'%(name)
    with open(path, "wb")as f:
        f.write(f_img)
  except Exception as e:
    print("---------地址出错------------")

url_list = []

f = requests.get("http://wufazhuce.com/")

# #打印网页内容
# print(f.content.decode())

soup = BeautifulSoup(f.content,"lxml")

try:
  first_div = soup.find("div",attrs={'id':'main-container'}).find('div',attrs={'class':'carousel-inner'})
  a_all = first_div.find_all('a')

  for i in a_all:
    url_list.append(i.attrs['href'])

except Exception as e:
    print("---------出错------------")

#得到one的首页推荐页面
f_1 = requests.get(url_list[0])

#打印网页内容
# print(f_1.content.decode())

soup_1 = BeautifulSoup(f_1.content,"lxml")

try:
  second_div = soup_1.find("div",attrs={'id':'main-container'}).find('div',attrs={'class':'one-cita-wrapper'})
  third_div = soup_1.find("div",attrs={'id':'main-container'}).find('div',attrs={'class':'one-imagen'})

  #获得时期值
  now_month = second_div.find('p',attrs={'class':'may'}).text
  now_one_day = second_div.find('p',attrs={'class':'dom'}).text

  #获得图片的url
  img_url = third_div.find('img').attrs['src']

  #获得一段话并去除开头的空格
  one_text = second_div.find("div",attrs={'class':'one-cita'}).text.strip()

  #将获得日期拼接
  now_day = now_one_day +' '+ now_month

  #调用函数下载图片

  download_img(img_url, now_day)

except Exception as e:
    print("---------出错------------")

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python远程登录代码
Apr 29 Python
python实现给数组按片赋值的方法
Jul 28 Python
浅析Python中元祖、列表和字典的区别
Aug 17 Python
Tensorflow简单验证码识别应用
May 25 Python
Python使用matplotlib绘制三维图形示例
Aug 25 Python
Python银行系统实战源码
Oct 25 Python
Python3常见函数range()用法详解
Dec 30 Python
Python实现搜索算法的实例代码
Jan 02 Python
推荐8款常用的Python GUI图形界面开发框架
Feb 23 Python
Python应用实现处理excel数据过程解析
Jun 19 Python
PyCharm最新激活码PyCharm2020.2.3有效
Nov 18 Python
python语言中pandas字符串分割str.split()函数
Aug 05 Python
python 五子棋如何获得鼠标点击坐标
Nov 04 #Python
Pandas 缺失数据处理的实现
Nov 04 #Python
python tkinter canvas使用实例
Nov 04 #Python
python matplotlib饼状图参数及用法解析
Nov 04 #Python
python制作朋友圈九宫格图片
Nov 03 #Python
python使用yield压平嵌套字典的超简单方法
Nov 02 #Python
基于python实现从尾到头打印链表
Nov 02 #Python
You might like
模拟OICQ的实现思路和核心程序(二)
2006/10/09 PHP
PHP文件缓存内容保存格式实例分析
2014/08/20 PHP
php按单词截取字符串的方法
2015/04/07 PHP
laravel 5.4 + vue + vux + element的环境搭配过程介绍
2018/04/26 PHP
PHP addAttribute()函数讲解
2019/02/03 PHP
jQuery 技巧小结
2010/04/02 Javascript
javascript工具库代码
2012/03/29 Javascript
JS异常处理的一个想法(sofish)
2013/03/14 Javascript
中文输入法不触发onkeyup事件的解决办法
2014/07/09 Javascript
移动端脚本框架Hammer.js
2016/12/15 Javascript
用React-Native+Mobx做一个迷你水果商城APP(附源码)
2017/12/25 Javascript
javascript系统时间设置操作示例
2019/06/17 Javascript
vue祖孙组件之间的数据传递案例
2020/12/07 Vue.js
[02:42]完美大师赛主赛事淘汰赛第三日观众采访
2017/11/25 DOTA
[52:20]DOTA2-DPC中国联赛正赛 SAG vs XGBO3 第一场 3月5日
2021/03/11 DOTA
Python使用Flask框架获取当前查询参数的方法
2015/03/21 Python
浅谈插入排序算法在Python程序中的实现及简单改进
2016/05/04 Python
Python Numpy 数组的初始化和基本操作
2018/03/13 Python
详解Python中的测试工具
2019/06/09 Python
python实现名片管理器的示例代码
2019/12/17 Python
Python Websocket服务端通信的使用示例
2020/02/25 Python
python 装饰器功能与用法案例详解
2020/03/06 Python
Python3如何使用多线程升程序运行速度
2020/08/11 Python
Carter’s官方旗舰店:美国受欢迎的婴童服装品牌
2018/01/21 全球购物
WWE美国职业摔角官方商店:WWE Shop
2018/11/15 全球购物
印度最好的在线药品订购网站:PharmEasy
2018/11/30 全球购物
俄罗斯三星品牌商店:Samsungstore
2020/04/05 全球购物
腾讯技术类校园招聘笔试试题
2014/05/06 面试题
.net面试题
2016/09/17 面试题
如何查找网页漏洞
2016/06/22 面试题
班组长安全生产职责
2013/12/16 职场文书
《春笋》教学反思
2014/04/15 职场文书
绿色环保口号
2014/06/12 职场文书
2014年青年教师工作总结
2014/12/17 职场文书
教你利用python实现企业微信发送消息
2021/05/23 Python
Redis Lua脚本实现ip限流示例
2022/07/15 Redis