编程 Python

使用requests库制作Python爬虫

Posted in Python onMarch 25, 2018

使用python爬虫其实就是方便，它会有各种工具类供你来使用，很方便。Java不可以吗？也可以，使用httpclient工具、还有一个大神写的webmagic框架，这些都可以实现爬虫，只不过python集成工具库，使用几行爬取，而Java需要写更多的行来实现，但目的都是一样。

下面介绍requests库简单使用：

#!/usr/local/env python
# coding:utf-8

import requests

#下面开始介绍requests的使用，环境语言是python3，使用下面的网址作为参考
#http://www.sse.com.cn/market/bonddata/data/tb/

request_param = {'jsonCallBack': 'jsonpCallback6588',
   'isPagination': 'true',
   'sqlId': 'COMMON_BOND_XXPL_ZQXX_L',
   'BONDTYPE': '地×××府债券',
   'pageHelp.pageSize': '25',
   'pageHelp.pageNo': '2',
   'pageHelp.beginPage': '2',
   'pageHelp.cacheSize': '1',
   'pageHelp.endPage': '21'}

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
referer = 'http://www.sse.com.cn/market/bonddata/data/ltb/'
#设置headers
headers = {'User-Agent': user_agent, 'Referer': referer}
#设置代理
proxy = {
 "http":"http://113.214.13.1:8000"
}

# 需要请求的URL地址
request_url = 'http://query.sse.com.cn/commonQuery.do?'

#设置请求地址
response = requests.get(request_url, headers=headers, proxies=proxy, params=request_param);
print(response.status_code)
#文本响应内容
print(response.text)
#json格式响应内容
print(response.json())
#二进制响应内容
print(response.content)
#原始格式
print(response.raw)

- Author -

豆芽菜橙

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

利用soaplib搭建webservice详细步骤和实例代码

Nov 20 Python

关于你不想知道的所有Python3 unicode特性

Nov 28 Python

python Django框架实现自定义表单提交

Mar 25 Python

关于Python中Inf与Nan的判断问题详解

Feb 08 Python

浅谈python 读excel数值为浮点型的问题

Dec 25 Python

对django xadmin自定义菜单的实例详解

Jan 03 Python

Python socket模块实现的udp通信功能示例

Apr 10 Python

Python 异常处理Ⅳ过程图解

Oct 18 Python

PyCharm下载和安装详细步骤

Dec 17 Python

Python tcp传输代码实例解析

Mar 18 Python

Python环境管理virtualenv&virtualenvwrapper的配置详解

Jul 01 Python

详解KMP算法以及python如何实现

Sep 18 Python

利用Python代码实现数据可视化的5种方法详解

Mar 25 #Python

Python cookbook(数据结构与算法)同时对数据做转换和换算处理操作示例

Mar 23 #Python

教你使用python实现微信每天给女朋友说晚安

Mar 23 #Python

python微信公众号开发简单流程

Mar 23 #Python

python3如何将docx转换成pdf文件

Mar 23 #Python

python实现csv格式文件转为asc格式文件的方法

Mar 23 #Python

python字典快速保存于读取的方法

Mar 23 #Python

You might like

PHP4之真OO

2006/10/09 PHP

php header()函数使用说明

2008/07/10 PHP

PHP中str_replace函数使用小结

2008/10/11 PHP

浅析is_writable的php实现

2013/06/18 PHP

php缓存技术详细总结

2013/08/07 PHP

yii2-GridView在开发中常用的功能及技巧总结

2017/01/07 PHP

PHP swoole和redis异步任务实现方法分析

2019/08/12 PHP

Yii框架组件的事件机制原理与用法分析

2020/04/07 PHP

TNC vs IO BO3 第一场2.13

2021/03/10 DOTA

javascript实现仿银行密码输入框效果的代码

2007/12/13 Javascript

JavaScript中创建类/对象的几种方法总结

2013/11/29 Javascript

js 操作select与option(示例讲解)

2013/12/20 Javascript

jquery跨域请求示例分享(jquery发送ajax请求)

2014/03/25 Javascript

在JavaScript中使用NaN值的方法

2015/06/05 Javascript

jQuery插件简单实现方法

2015/07/18 Javascript

jquery实现TAB选项卡鼠标经过带延迟效果的方法

2015/07/27 Javascript

Vue.js学习笔记之常用模板语法详解

2017/07/25 Javascript

详解vue.js之绑定class和style的示例代码

2017/08/24 Javascript

学习node.js 断言的使用详解

2019/03/18 Javascript

JS实现iframe中子父页面跨域通讯的方法分析

2020/03/10 Javascript

基于原生js实现九宫格算法代码实例

2020/07/03 Javascript

python使用reportlab画图示例（含中文汉字）

2013/12/03 Python

python如何拆分含有多种分隔符的字符串

2018/03/20 Python

python retrying模块的使用方法详解

2019/09/25 Python

iPython pylab模式启动方式

2020/04/24 Python

html5开发三八女王节表白神器

2018/03/07 HTML / CSS

漫威玩具服装及周边商品官方购物网站：Marvel Shop

2019/05/11 全球购物

英国第一独立滑雪板商店：The Snowboard Asylum

2020/01/16 全球购物

财务工作个人求职的自我评价

2013/12/19 职场文书

党校培训自我鉴定范文

2014/04/10 职场文书

学前班语言教学计划

2015/01/20 职场文书

2015年人事工作总结范文

2015/04/09 职场文书

保护地球的宣传语

2015/07/13 职场文书

eclipse创建项目没有dynamic web的解决方法

2021/06/24 Java/Android

详解gantt甘特图可拖拽、编辑(vue、react都可用 highcharts)

2021/11/27 Vue.js

vue使用echarts实现折线图

2022/03/21 Vue.js