使用requests库制作Python爬虫


Posted in Python onMarch 25, 2018

使用python爬虫其实就是方便,它会有各种工具类供你来使用,很方便。Java不可以吗?也可以,使用httpclient工具、还有一个大神写的webmagic框架,这些都可以实现爬虫,只不过python集成工具库,使用几行爬取,而Java需要写更多的行来实现,但目的都是一样。

下面介绍requests库简单使用:

#!/usr/local/env python
# coding:utf-8

import requests

#下面开始介绍requests的使用,环境语言是python3,使用下面的网址作为参考
#http://www.sse.com.cn/market/bonddata/data/tb/

request_param = {'jsonCallBack': 'jsonpCallback6588',
   'isPagination': 'true',
   'sqlId': 'COMMON_BOND_XXPL_ZQXX_L',
   'BONDTYPE': '地×××府债券',
   'pageHelp.pageSize': '25',
   'pageHelp.pageNo': '2',
   'pageHelp.beginPage': '2',
   'pageHelp.cacheSize': '1',
   'pageHelp.endPage': '21'}

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
referer = 'http://www.sse.com.cn/market/bonddata/data/ltb/'
#设置headers
headers = {'User-Agent': user_agent, 'Referer': referer}
#设置代理
proxy = {
 "http":"http://113.214.13.1:8000"
}

# 需要请求的URL地址
request_url = 'http://query.sse.com.cn/commonQuery.do?'

#设置请求地址
response = requests.get(request_url, headers=headers, proxies=proxy, params=request_param);
print(response.status_code)
#文本响应内容
print(response.text)
#json格式响应内容
print(response.json())
#二进制响应内容
print(response.content)
#原始格式
print(response.raw)
Python 相关文章推荐
Python日期操作学习笔记
Oct 07 Python
Mac下Supervisor进程监控管理工具的安装与配置
Dec 16 Python
python实现图片处理和特征提取详解
Nov 13 Python
Python爬虫实现简单的爬取有道翻译功能示例
Jul 13 Python
基于DataFrame改变列类型的方法
Jul 25 Python
tensorflow更改变量的值实例
Jul 30 Python
解决Mac下首次安装pycharm无project interpreter的问题
Oct 29 Python
python实现日志按天分割
Jul 22 Python
python3实现带多张图片、附件的邮件发送
Aug 10 Python
tensorflow实现测试时读取任意指定的check point的网络参数
Jan 21 Python
Python中对象的比较操作==和is区别详析
Feb 12 Python
解决Pytorch dataloader时报错每个tensor维度不一样的问题
May 28 Python
利用Python代码实现数据可视化的5种方法详解
Mar 25 #Python
Python cookbook(数据结构与算法)同时对数据做转换和换算处理操作示例
Mar 23 #Python
教你使用python实现微信每天给女朋友说晚安
Mar 23 #Python
python微信公众号开发简单流程
Mar 23 #Python
python3如何将docx转换成pdf文件
Mar 23 #Python
python实现csv格式文件转为asc格式文件的方法
Mar 23 #Python
python字典快速保存于读取的方法
Mar 23 #Python
You might like
把从SQL中取出的数据转化成XMl格式
2006/10/09 PHP
php strstr查找字符串中是否包含某些字符的查找函数
2010/06/03 PHP
跟我学Laravel之路由
2014/10/15 PHP
PHP实现可自定义样式的分页类
2016/03/29 PHP
phpmailer绑定邮箱的实现方法
2016/12/01 PHP
DOM精简教程
2006/10/03 Javascript
在Windows上安装Node.js模块的方法
2011/09/25 Javascript
js 实现菜单左右滚动显示示例介绍
2013/11/21 Javascript
div失去焦点事件实现思路
2014/04/22 Javascript
javascript抽象工厂模式详细说明
2014/12/16 Javascript
bootstrap中使用google prettify让代码高亮的方法
2016/10/21 Javascript
ubuntu编译nodejs所需的软件并安装
2017/09/12 NodeJs
jQuery图片查看插件Magnify开发详解
2017/12/25 jQuery
Express之托管静态文件的方法
2018/06/01 Javascript
Angularjs中的$apply及优化使用详解
2018/07/02 Javascript
Puppet的一些技巧
2018/09/17 Javascript
微信小程序获取用户绑定手机号方法示例
2019/07/21 Javascript
nuxt踩坑之Vuex状态树的模块方式使用详解
2019/09/06 Javascript
[57:59]完美世界DOTA2联赛循环赛 Ink Ice vs LBZS BO2第一场 11.05
2020/11/05 DOTA
Python抓取手机号归属地信息示例代码
2016/11/28 Python
python 连接sqlite及简单操作
2017/06/30 Python
Python字典,函数,全局变量代码解析
2017/12/18 Python
从运行效率与开发效率比较Python和C++
2018/12/14 Python
Python的numpy库下的几个小函数的用法(小结)
2019/07/12 Python
pytorch:torch.mm()和torch.matmul()的使用
2019/12/27 Python
python GUI库图形界面开发之PyQt5浏览器控件QWebEngineView详细使用方法
2020/02/26 Python
Django Serializer HiddenField隐藏字段实例
2020/03/31 Python
下面关于"联合"的题目的输出是什么
2013/08/06 面试题
外语专业毕业生自我评价分享
2013/10/05 职场文书
医学院学生的自我评价分享
2013/11/19 职场文书
工地质量标语
2014/06/12 职场文书
优秀班组事迹材料
2014/12/24 职场文书
2016年母亲节寄语
2015/12/04 职场文书
员工保密协议范本,您一定得收藏!很有用!
2019/08/08 职场文书
java executor包参数处理功能 
2022/02/15 Java/Android
B站评分公认最好看的动漫,你的名字评分9.9,第六备受喜欢
2022/03/18 日漫