使用requests库制作Python爬虫


Posted in Python onMarch 25, 2018

使用python爬虫其实就是方便,它会有各种工具类供你来使用,很方便。Java不可以吗?也可以,使用httpclient工具、还有一个大神写的webmagic框架,这些都可以实现爬虫,只不过python集成工具库,使用几行爬取,而Java需要写更多的行来实现,但目的都是一样。

下面介绍requests库简单使用:

#!/usr/local/env python
# coding:utf-8

import requests

#下面开始介绍requests的使用,环境语言是python3,使用下面的网址作为参考
#http://www.sse.com.cn/market/bonddata/data/tb/

request_param = {'jsonCallBack': 'jsonpCallback6588',
   'isPagination': 'true',
   'sqlId': 'COMMON_BOND_XXPL_ZQXX_L',
   'BONDTYPE': '地×××府债券',
   'pageHelp.pageSize': '25',
   'pageHelp.pageNo': '2',
   'pageHelp.beginPage': '2',
   'pageHelp.cacheSize': '1',
   'pageHelp.endPage': '21'}

user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
referer = 'http://www.sse.com.cn/market/bonddata/data/ltb/'
#设置headers
headers = {'User-Agent': user_agent, 'Referer': referer}
#设置代理
proxy = {
 "http":"http://113.214.13.1:8000"
}

# 需要请求的URL地址
request_url = 'http://query.sse.com.cn/commonQuery.do?'

#设置请求地址
response = requests.get(request_url, headers=headers, proxies=proxy, params=request_param);
print(response.status_code)
#文本响应内容
print(response.text)
#json格式响应内容
print(response.json())
#二进制响应内容
print(response.content)
#原始格式
print(response.raw)
Python 相关文章推荐
python控制台英汉汉英电子词典
Apr 23 Python
图文详解WinPE下安装Python
May 17 Python
Python基于分水岭算法解决走迷宫游戏示例
Sep 26 Python
Python栈算法的实现与简单应用示例
Nov 01 Python
python制作mysql数据迁移脚本
Jan 01 Python
python实现kmp算法的实例代码
Apr 03 Python
Pytorch之Variable的用法
Dec 31 Python
Python 窗体(tkinter)下拉列表框(Combobox)实例
Mar 04 Python
python使用建议与技巧分享(一)
Aug 17 Python
详解KMP算法以及python如何实现
Sep 18 Python
Python中Selenium对Cookie的操作方法
Jul 09 Python
详解Python+OpenCV绘制灰度直方图
Mar 22 Python
利用Python代码实现数据可视化的5种方法详解
Mar 25 #Python
Python cookbook(数据结构与算法)同时对数据做转换和换算处理操作示例
Mar 23 #Python
教你使用python实现微信每天给女朋友说晚安
Mar 23 #Python
python微信公众号开发简单流程
Mar 23 #Python
python3如何将docx转换成pdf文件
Mar 23 #Python
python实现csv格式文件转为asc格式文件的方法
Mar 23 #Python
python字典快速保存于读取的方法
Mar 23 #Python
You might like
玩转虚拟域名◎+ .
2006/10/09 PHP
php用正则表达式匹配中文实例详解
2013/11/06 PHP
隐性调用php程序的方法
2015/06/13 PHP
php实现的单一入口应用程序实例分析
2015/09/23 PHP
php微信开发之谷歌测距
2018/06/14 PHP
jQuery JSON的解析方式分享
2011/04/05 Javascript
基于jquery的网站幻灯片切换效果焦点图代码
2013/09/15 Javascript
jquery用ajax方式从后台获取json数据后如何将内容填充到下拉列表
2015/08/26 Javascript
浅谈JavaScript中的string拥有方法的原因
2015/08/28 Javascript
详解使用JS如何制作简单的ASCII图与单极图
2017/03/31 Javascript
React.js中常用的ES6写法总结(推荐)
2017/05/09 Javascript
Textarea输入字数限制实例(兼容iOS&安卓)
2017/07/06 Javascript
基于vue组件实现猜数字游戏
2020/05/28 Javascript
vue调用语音播放的方法
2019/09/27 Javascript
VUEX 数据持久化,刷新后重新获取的例子
2019/11/12 Javascript
多个Vue项目部署到服务器的步骤记录
2020/10/22 Javascript
echarts浮动显示单位的实现方法示例
2020/12/04 Javascript
python实现域名系统(DNS)正向查询的方法
2016/04/19 Python
对Python字符串中的换行符和制表符介绍
2018/05/03 Python
解决python 自动安装缺少模块的问题
2018/10/22 Python
使用python 打开文件并做匹配处理的实例
2019/01/02 Python
Python将json文件写入ES数据库的方法
2019/04/10 Python
Django如何防止定时任务并发浅析
2019/05/14 Python
Python 窗体(tkinter)下拉列表框(Combobox)实例
2020/03/04 Python
如何在mac版pycharm选择python版本
2020/07/21 Python
css3实现信纸/同学录效果的示例代码
2018/12/11 HTML / CSS
英国体育器材进口商店:UK Sport Imports
2017/03/14 全球购物
Kent & Curwen:与大卫·贝克汉姆合作
2017/06/13 全球购物
德国著名廉价网上药店:Shop-Apotheke
2017/07/23 全球购物
美国名牌手表折扣网站:Jomashop
2020/05/22 全球购物
建筑项目策划书
2014/01/13 职场文书
关于九一八事变的演讲稿2014
2014/09/17 职场文书
2015元旦晚会主持人开场白+结束语
2014/12/14 职场文书
数学教师个人工作总结
2015/02/06 职场文书
《风娃娃》教学反思
2016/02/18 职场文书
准备去美国留学,那么大学申请文书应该怎么写?
2019/08/12 职场文书