使用requests库制作Python爬虫


Posted in Python onMarch 25, 2018

使用python爬虫其实就是方便,它会有各种工具类供你来使用,很方便。Java不可以吗?也可以,使用httpclient工具、还有一个大神写的webmagic框架,这些都可以实现爬虫,只不过python集成工具库,使用几行爬取,而Java需要写更多的行来实现,但目的都是一样。

下面介绍requests库简单使用:

#!/usr/local/env python
# coding:utf-8

import requests

#下面开始介绍requests的使用,环境语言是python3,使用下面的网址作为参考
#http://www.sse.com.cn/market/bonddata/data/tb/

request_param = {'jsonCallBack': 'jsonpCallback6588',
   'isPagination': 'true',
   'sqlId': 'COMMON_BOND_XXPL_ZQXX_L',
   'BONDTYPE': '地×××府债券',
   'pageHelp.pageSize': '25',
   'pageHelp.pageNo': '2',
   'pageHelp.beginPage': '2',
   'pageHelp.cacheSize': '1',
   'pageHelp.endPage': '21'}

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
referer = 'http://www.sse.com.cn/market/bonddata/data/ltb/'
#设置headers
headers = {'User-Agent': user_agent, 'Referer': referer}
#设置代理
proxy = {
 "http":"http://113.214.13.1:8000"
}

# 需要请求的URL地址
request_url = 'http://query.sse.com.cn/commonQuery.do?'

#设置请求地址
response = requests.get(request_url, headers=headers, proxies=proxy, params=request_param);
print(response.status_code)
#文本响应内容
print(response.text)
#json格式响应内容
print(response.json())
#二进制响应内容
print(response.content)
#原始格式
print(response.raw)
Python 相关文章推荐
python实现文件分组复制到不同目录的例子
Jun 04 Python
用Python程序抓取网页的HTML信息的一个小实例
May 02 Python
Python的网络编程库Gevent的安装及使用技巧
Jun 24 Python
独特的python循环语句
Nov 20 Python
浅谈python可视化包Bokeh
Feb 07 Python
python散点图实例之随机漫步
Aug 27 Python
Python redis操作实例分析【连接、管道、发布和订阅等】
May 16 Python
Django REST framework 视图和路由详解
Jul 19 Python
如何通过python的fabric包完成代码上传部署
Jul 29 Python
Python综合应用名片管理系统案例详解
Jan 03 Python
Python加载数据的5种不同方式(收藏)
Nov 13 Python
详解python使用金山词霸的翻译功能(调试工具断点的使用)
Jan 07 Python
利用Python代码实现数据可视化的5种方法详解
Mar 25 #Python
Python cookbook(数据结构与算法)同时对数据做转换和换算处理操作示例
Mar 23 #Python
教你使用python实现微信每天给女朋友说晚安
Mar 23 #Python
python微信公众号开发简单流程
Mar 23 #Python
python3如何将docx转换成pdf文件
Mar 23 #Python
python实现csv格式文件转为asc格式文件的方法
Mar 23 #Python
python字典快速保存于读取的方法
Mar 23 #Python
You might like
Javascript与PHP验证用户输入URL地址是否正确
2014/10/09 PHP
php实现阿拉伯数字和罗马数字相互转换的方法
2015/04/17 PHP
PHP从尾到头打印链表实例讲解
2018/09/27 PHP
浅析JavaScript中的delete运算符
2013/11/30 Javascript
关闭浏览器时提示onbeforeunload事件
2013/12/25 Javascript
QQ登录背景闪动效果附效果演示源码下载
2015/09/22 Javascript
探究Javascript模板引擎mustache.js使用方法
2016/01/26 Javascript
Javascript数组中push方法用法分析
2016/10/31 Javascript
基于JavaScript实现全选、不选和反选效果
2017/02/15 Javascript
Angular模板表单校验方法详解
2017/08/11 Javascript
webpack3+React 的配置全解
2017/08/21 Javascript
jQuery+datatables插件实现ajax加载数据与增删改查功能示例
2018/04/17 jQuery
Vue 自适应高度表格的实现方法
2020/05/13 Javascript
Vue 基于 vuedraggable 实现选中、拖拽、排序效果
2020/05/18 Javascript
springboot+vue+对接支付宝接口+二维码扫描支付功能(沙箱环境)
2020/10/15 Javascript
vue实现可移动的悬浮按钮
2021/03/04 Vue.js
pandas表连接 索引上的合并方法
2018/06/08 Python
python 自定义对象的打印方法
2019/01/12 Python
python三大神器之fabric使用教程
2019/06/10 Python
Django 中自定义 Admin 样式与功能的实现方法
2019/07/04 Python
python:按行读入,排序然后输出的方法
2019/07/20 Python
Python 读取 YUV(NV12) 视频文件实例
2019/12/09 Python
win10下python2和python3共存问题解决方法
2019/12/23 Python
对tensorflow中cifar-10文档的Read操作详解
2020/02/10 Python
python爬虫开发之使用Python爬虫库requests多线程抓取猫眼电影TOP100实例
2020/03/10 Python
PyQt5结合matplotlib绘图的实现示例
2020/09/15 Python
美国知名女性服饰品牌:New York & Company
2017/03/23 全球购物
Vichy薇姿加拿大官网:法国药妆,全球专业敏感肌护肤领先品牌
2018/07/11 全球购物
俄罗斯连接商品和买家的在线平台:goods.ru
2020/11/30 全球购物
毕业生精彩的自我评价分享
2013/10/06 职场文书
工商管理毕业生推荐信
2013/12/24 职场文书
工作交流会欢迎词
2014/01/12 职场文书
创建精神文明单位实施方案
2014/03/08 职场文书
2015年企业工作总结范文
2015/04/28 职场文书
刑事附带民事代理词
2015/05/25 职场文书
Win11如何默认打开软件界面最大化?Win11默认打开软件界面最大化的方法
2022/07/15 数码科技