使用requests库制作Python爬虫


Posted in Python onMarch 25, 2018

使用python爬虫其实就是方便,它会有各种工具类供你来使用,很方便。Java不可以吗?也可以,使用httpclient工具、还有一个大神写的webmagic框架,这些都可以实现爬虫,只不过python集成工具库,使用几行爬取,而Java需要写更多的行来实现,但目的都是一样。

下面介绍requests库简单使用:

#!/usr/local/env python
# coding:utf-8

import requests

#下面开始介绍requests的使用,环境语言是python3,使用下面的网址作为参考
#http://www.sse.com.cn/market/bonddata/data/tb/

request_param = {'jsonCallBack': 'jsonpCallback6588',
   'isPagination': 'true',
   'sqlId': 'COMMON_BOND_XXPL_ZQXX_L',
   'BONDTYPE': '地×××府债券',
   'pageHelp.pageSize': '25',
   'pageHelp.pageNo': '2',
   'pageHelp.beginPage': '2',
   'pageHelp.cacheSize': '1',
   'pageHelp.endPage': '21'}

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
referer = 'http://www.sse.com.cn/market/bonddata/data/ltb/'
#设置headers
headers = {'User-Agent': user_agent, 'Referer': referer}
#设置代理
proxy = {
 "http":"http://113.214.13.1:8000"
}

# 需要请求的URL地址
request_url = 'http://query.sse.com.cn/commonQuery.do?'

#设置请求地址
response = requests.get(request_url, headers=headers, proxies=proxy, params=request_param);
print(response.status_code)
#文本响应内容
print(response.text)
#json格式响应内容
print(response.json())
#二进制响应内容
print(response.content)
#原始格式
print(response.raw)
Python 相关文章推荐
在Python中操作日期和时间之gmtime()方法的使用
May 22 Python
python数据清洗系列之字符串处理详解
Feb 12 Python
Python三种遍历文件目录的方法实例代码
Jan 19 Python
Python subprocess库的使用详解
Oct 26 Python
在Qt中正确的设置窗体的背景图片的几种方法总结
Jun 19 Python
基于多进程中APScheduler重复运行的解决方法
Jul 22 Python
创建Shapefile文件并写入数据的例子
Nov 26 Python
Python *args和**kwargs用法实例解析
Mar 02 Python
Python dict和defaultdict使用实例解析
Mar 12 Python
Python直接赋值及深浅拷贝原理详解
Sep 05 Python
python 实现IP子网计算
Feb 18 Python
Python实现Matplotlib,Seaborn动态数据图
May 06 Python
利用Python代码实现数据可视化的5种方法详解
Mar 25 #Python
Python cookbook(数据结构与算法)同时对数据做转换和换算处理操作示例
Mar 23 #Python
教你使用python实现微信每天给女朋友说晚安
Mar 23 #Python
python微信公众号开发简单流程
Mar 23 #Python
python3如何将docx转换成pdf文件
Mar 23 #Python
python实现csv格式文件转为asc格式文件的方法
Mar 23 #Python
python字典快速保存于读取的方法
Mar 23 #Python
You might like
PHP个人网站架设连环讲(二)
2006/10/09 PHP
php源代码安装常见错误与解决办法分享
2013/05/28 PHP
php连接函数implode与分割explode的深入解析
2013/06/26 PHP
PHP反射机制用法实例
2014/08/28 PHP
php post大量数据时发现数据丢失问题解决方法
2015/06/20 PHP
高质量PHP代码的50个实用技巧必备(下)
2016/01/22 PHP
PHP Callable强制指定回调类型的方法
2016/08/30 PHP
php简单压缩css样式示例
2016/09/22 PHP
PHP设计模式之工厂方法设计模式实例分析
2018/04/25 PHP
js截取函数(indexOf,join等)
2010/09/01 Javascript
js和as的稳定传值问题解决
2013/07/14 Javascript
Ext中下拉列表ComboBox组件store数据格式用法介绍
2013/07/15 Javascript
用js代码改变单选框选中状态的简单实例
2013/12/18 Javascript
javascript类型转换使用方法
2014/02/08 Javascript
JS函数重载的解决方案
2014/05/13 Javascript
jQuery实现页面内锚点平滑跳转特效的方法总结
2015/05/11 Javascript
详细谈谈javascript的对象
2016/07/31 Javascript
js基本算法:冒泡排序,二分查找的简单实例
2016/10/08 Javascript
Ajax基础知识详解
2017/02/17 Javascript
vue项目开发中setTimeout等定时器的管理问题
2018/09/13 Javascript
浅谈js闭包理解
2019/03/28 Javascript
详解服务端预渲染之Nuxt(介绍篇)
2019/04/07 Javascript
vue通过数据过滤实现表格合并
2020/11/30 Javascript
vue 基于abstract 路由模式 实现页面内嵌的示例代码
2020/12/14 Vue.js
Python中函数及默认参数的定义与调用操作实例分析
2017/07/25 Python
Python3利用Dlib实现摄像头实时人脸检测和平铺显示示例
2019/02/21 Python
简单了解python代码优化小技巧
2019/07/08 Python
python 控制Asterisk AMI接口外呼电话的例子
2019/08/08 Python
python超时重新请求解决方案
2019/10/21 Python
浅谈Python访问MySQL的正确姿势
2020/01/07 Python
Python爬虫HTPP请求方法有哪些
2020/06/03 Python
CSS3教程(4):网页边框和网页文字阴影
2009/04/02 HTML / CSS
Argos官网:英国家喻户晓的百货零售连锁商
2017/04/03 全球购物
文员岗位职责
2015/02/04 职场文书
努力学习保证书
2015/02/26 职场文书
银行中层干部培训心得体会
2016/01/11 职场文书