使用requests库制作Python爬虫


Posted in Python onMarch 25, 2018

使用python爬虫其实就是方便,它会有各种工具类供你来使用,很方便。Java不可以吗?也可以,使用httpclient工具、还有一个大神写的webmagic框架,这些都可以实现爬虫,只不过python集成工具库,使用几行爬取,而Java需要写更多的行来实现,但目的都是一样。

下面介绍requests库简单使用:

#!/usr/local/env python
# coding:utf-8

import requests

#下面开始介绍requests的使用,环境语言是python3,使用下面的网址作为参考
#http://www.sse.com.cn/market/bonddata/data/tb/

request_param = {'jsonCallBack': 'jsonpCallback6588',
   'isPagination': 'true',
   'sqlId': 'COMMON_BOND_XXPL_ZQXX_L',
   'BONDTYPE': '地×××府债券',
   'pageHelp.pageSize': '25',
   'pageHelp.pageNo': '2',
   'pageHelp.beginPage': '2',
   'pageHelp.cacheSize': '1',
   'pageHelp.endPage': '21'}

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
referer = 'http://www.sse.com.cn/market/bonddata/data/ltb/'
#设置headers
headers = {'User-Agent': user_agent, 'Referer': referer}
#设置代理
proxy = {
 "http":"http://113.214.13.1:8000"
}

# 需要请求的URL地址
request_url = 'http://query.sse.com.cn/commonQuery.do?'

#设置请求地址
response = requests.get(request_url, headers=headers, proxies=proxy, params=request_param);
print(response.status_code)
#文本响应内容
print(response.text)
#json格式响应内容
print(response.json())
#二进制响应内容
print(response.content)
#原始格式
print(response.raw)
Python 相关文章推荐
利用soaplib搭建webservice详细步骤和实例代码
Nov 20 Python
关于你不想知道的所有Python3 unicode特性
Nov 28 Python
python Django框架实现自定义表单提交
Mar 25 Python
关于Python中Inf与Nan的判断问题详解
Feb 08 Python
浅谈python 读excel数值为浮点型的问题
Dec 25 Python
对django xadmin自定义菜单的实例详解
Jan 03 Python
Python socket模块实现的udp通信功能示例
Apr 10 Python
Python 异常处理Ⅳ过程图解
Oct 18 Python
PyCharm下载和安装详细步骤
Dec 17 Python
Python tcp传输代码实例解析
Mar 18 Python
Python环境管理virtualenv&virtualenvwrapper的配置详解
Jul 01 Python
详解KMP算法以及python如何实现
Sep 18 Python
利用Python代码实现数据可视化的5种方法详解
Mar 25 #Python
Python cookbook(数据结构与算法)同时对数据做转换和换算处理操作示例
Mar 23 #Python
教你使用python实现微信每天给女朋友说晚安
Mar 23 #Python
python微信公众号开发简单流程
Mar 23 #Python
python3如何将docx转换成pdf文件
Mar 23 #Python
python实现csv格式文件转为asc格式文件的方法
Mar 23 #Python
python字典快速保存于读取的方法
Mar 23 #Python
You might like
PHP4之真OO
2006/10/09 PHP
php header()函数使用说明
2008/07/10 PHP
PHP中str_replace函数使用小结
2008/10/11 PHP
浅析is_writable的php实现
2013/06/18 PHP
php缓存技术详细总结
2013/08/07 PHP
yii2-GridView在开发中常用的功能及技巧总结
2017/01/07 PHP
PHP swoole和redis异步任务实现方法分析
2019/08/12 PHP
Yii框架组件的事件机制原理与用法分析
2020/04/07 PHP
TNC vs IO BO3 第一场2.13
2021/03/10 DOTA
javascript实现仿银行密码输入框效果的代码
2007/12/13 Javascript
JavaScript中创建类/对象的几种方法总结
2013/11/29 Javascript
js 操作select与option(示例讲解)
2013/12/20 Javascript
jquery跨域请求示例分享(jquery发送ajax请求)
2014/03/25 Javascript
在JavaScript中使用NaN值的方法
2015/06/05 Javascript
jQuery插件简单实现方法
2015/07/18 Javascript
jquery实现TAB选项卡鼠标经过带延迟效果的方法
2015/07/27 Javascript
Vue.js学习笔记之常用模板语法详解
2017/07/25 Javascript
详解vue.js之绑定class和style的示例代码
2017/08/24 Javascript
学习node.js 断言的使用详解
2019/03/18 Javascript
JS实现iframe中子父页面跨域通讯的方法分析
2020/03/10 Javascript
基于原生js实现九宫格算法代码实例
2020/07/03 Javascript
python使用reportlab画图示例(含中文汉字)
2013/12/03 Python
python如何拆分含有多种分隔符的字符串
2018/03/20 Python
python retrying模块的使用方法详解
2019/09/25 Python
iPython pylab模式启动方式
2020/04/24 Python
html5开发三八女王节表白神器
2018/03/07 HTML / CSS
漫威玩具服装及周边商品官方购物网站:Marvel Shop
2019/05/11 全球购物
英国第一独立滑雪板商店:The Snowboard Asylum
2020/01/16 全球购物
财务工作个人求职的自我评价
2013/12/19 职场文书
党校培训自我鉴定范文
2014/04/10 职场文书
学前班语言教学计划
2015/01/20 职场文书
2015年人事工作总结范文
2015/04/09 职场文书
保护地球的宣传语
2015/07/13 职场文书
eclipse创建项目没有dynamic web的解决方法
2021/06/24 Java/Android
详解gantt甘特图可拖拽、编辑(vue、react都可用 highcharts)
2021/11/27 Vue.js
vue使用echarts实现折线图
2022/03/21 Vue.js